Projekte > MPEG-1/2 Video > Transport Stream

Extended Event Descriptor

Der Extended Event Descriptor ist in ETSI EN 300 468 definiert und enthält in Ergänzung des Short Event Descriptors eine detaillierte Beschreibung des Events. Die Items stellen einen in zwei Spalten strukturierten Text dar. Als typische Anwendung wird eine Liste der Darsteller angegeben.

Der Aufbau

  • extended_event_descriptor
    • 8 Bit: descriptor_tag
    • 8 Bit: descriptor_length
    • 4 Bit: descriptor_number
    • 4 Bit: last_descriptor_number
    • 24 Bit: ISO_639_language_code
    • 8 Bit: length_of_items
      • 8 Bit: item_descriptor_length
        • item_descriptor_length Byte: item_descriptor_char
      • item_length
        • item_length Byte: item_char
    • 8 Bit: text_length
      • text_length Byte: text_char

descriptor_tag: Der Tag identifiziert den Descriptor. Der extended_event_descriptor-Tag ist $4E.

descriptor_length: Die Länge des Descriptors ab dem folgenden Byte.

descriptor_number: Wenn der Inhalt nicht in einen Descriptor passt werden die Descriptoren durchnummeriert. Es wird mit 0 begonnen und die Nummer bei jedem weiteren Descriptor um 1 erhöht.

last_descriptor_number: Die Nummer des letzten Descriptors.

ISO_639_language_code: Die Sprache des Descriptors entsprechend der Norm ISO 639.

length_of_items: Die Länge der folgenden Items in Byte.

item_descriptor_length: Die Länge des Item-Descriptors in Byte.

item_descriptor_char: Der Item-Descriptor, die erste Spalte des strukturierten Textes. Im ersten Zeichen ist der Character Set codiert. Im weiteren Text können control codes enthalten sein.

item_length: Die Länge des Items in Byte.

item_char: Das Item, die zweite Spalte des strukturierten Textes. Der Text ist als lateinisches Alphabet codiert. Befindet sich das erste Byte im Wertebereich von $01 bis $1F, gibt dieses Byte ein abweichendes Character Set an. Der Text kann ausserdem Controlcodes enthalten.

text_length: Die Länge des Textes in Byte.

text_char: Der Text. Das heißt die Beschreibung des Events. Der Text ist als lateinisches Alphabet codiert. Befindet sich das erste Byte im Wertebereich von $01 bis $1F, gibt dieses Byte ein abweichendes Character Set an. Der Text kann ausserdem Controlcodes enthalten.

Character Sets

Wenn keine Codierung angegeben ist: ISO 6937

Control Codes für Einzelbyte Character Sets

  • $80-$85: Reserviert für zukünftige Nutzung
  • $86: character emphasis on
  • $87: character emphasis off
  • $88-$89: Reserviert für zukünfitge Nutzung
  • $8A: CR/LF
  • $8B-$9F: Nutzerdefiniert

Bei UTF-8 geht diesen control codes ein $C2 voran.