Avatar
www.fr-an.de

Transport Stream

Extended Event Descriptor

Der Extended Event Descriptor ist in ETSI EN 300 468 definiert und enthält in Ergänzung des Short Event Descriptors eine detaillierte Beschreibung des Events. Die Items stellen einen in zwei Spalten strukturierten Text dar. Als typische Anwendung wird eine Liste der Darsteller angegeben.

 

Der Aufbau

  1. extended_event_descriptor
    1. 8 Bit: descriptor_tag
    2. 8 Bit: descriptor_length
    3. 4 Bit: descriptor_number
    4. 4 Bit: last_descriptor_number
    5. 24 Bit: ISO_639_language_code
    6. 8 Bit: length_of_items
      1. 8 Bit: item_descriptor_length
        1. item_descriptor_length Byte: item_descriptor_char
      2. item_length
        1. item_length Byte: item_char
    7. 8 Bit: text_length
      1. text_length Byte: text_char

 

descriptor_tag: Der Tag identifiziert den Descriptor. Der extended_event_descriptor-Tag ist $4E.

descriptor_length: Die Länge des Descriptors ab dem folgenden Byte.

descriptor_number: Wenn der Inhalt nicht in einen Descriptor passt werden die Descriptoren durchnummeriert. Es wird mit 0 begonnen und die Nummer bei jedem weiteren Descriptor um 1 erhöht.

last_descriptor_number: Die Nummer des letzten Descriptors.

ISO_639_language_code: Die Sprache des Descriptors entsprechend der Norm ISO 639.

length_of_items: Die Länge der folgenden Items in Byte.

item_descriptor_length: Die Länge des Item-Descriptors in Byte.

item_descriptor_char: Der Item-Descriptor, die erste Spalte des strukturierten Textes. Im ersten Zeichen ist der Character Set codiert. Im weiteren Text können control codes enthalten sein.

item_length: Die Länge des Items in Byte.

item_char: Das Item, die zweite Spalte des strukturierten Textes. Der Text ist als lateinisches Alphabet codiert. Befindet sich das erste Byte im Wertebereich von $01 bis $1F, gibt dieses Byte ein abweichendes Character Set an. Der Text kann ausserdem Controlcodes enthalten.

text_length: Die Länge des Textes in Byte.

text_char: Der Text. Das heißt die Beschreibung des Events. Der Text ist als lateinisches Alphabet codiert. Befindet sich das erste Byte im Wertebereich von $01 bis $1F, gibt dieses Byte ein abweichendes Character Set an. Der Text kann ausserdem Controlcodes enthalten.

 

Character Sets

Wenn keine Codierung angegeben ist: ISO 6937

  1. $01: ISO/IEC 8859-5 Kyrillisch
  2. $02: ISO/IEC 8859-6 Arabisch
  3. $03: ISO/IEC 8859-7 Griechisch
  4. $04: ISO/IEC 8859-8 Hebräisch
  5. $05: ISO/IEC 8859-9 Latin-5, Türkisch
  6. $06: ISO/IEC 8859-10 Latin-6, Nordisch
  7. $07: ISO/IEC 8859-11 Thai
  8. $08: ISO/IEC 8859-12 Für Indisch reserviert
  9. $09: ISO/IEC 8859-13 Latin-7, Baltisch
  10. $0A: ISO/IEC 8859-14 Latin-8, Keltisch
  11. $0B: ISO/IEC 8859-15 Latin-9, Westeuropäisch
  12. $0C-$0F: Reserviert für zukünftige Nutzung
  13. $10: ISO/IEC 8859
    Da es sich um eine Normenfamilie handelt, folgen zwei Byte, wovon das erste Byte den Wert $00 hat und das zweite die Teilnorm angibt:
    1. $00: Reserviert für zukünftige Nutzung
    2. $01: ISO/IEC 8859-1 Latin-1, Westeuropäisch
    3. $02: ISO/IEC 8859-2 Latin-2, Mitteleuropäisch
    4. $03: ISO/IEC 8859-3 Latin-3, Südeuropäisch
    5. $04: ISO/IEC 8859-4 Latin-4, Nordeuropäisch
    6. $05: ISO/IEC 8859-5 Kyrillisch
    7. $06: ISO/IEC 8859-6 Arabisch
    8. $07: ISO/IEC 8859-7 Griechisch
    9. $08: ISO/IEC 8859-8 Hebräisch
    10. $09: ISO/IEC 8859-9 Latin-5, Türkisch
    11. $0A: ISO/IEC 8859-10 Latin-6, Nordisch
    12. $0B: ISO/IEC 8859-11 Thai
    13. $0C: Reserviert für zukünftige Nutzung
    14. $0D: ISO/IEC 8859-13 Latin-7, Baltisch
    15. $0E: ISO/IEC 8859-14 Latin-8, Keltisch
    16. $0F: ISO/IEC 8859-15 Latin-9, Westeuropäisch
  14. $11: ISO/IEC 10646-1 Basic Multilingual Plane
  15. $12: KSX1001-2004 Korean Character Set
  16. $13: GB-2312-1980 Simplified Chinese Character
  17. $14: Big5 subset ISO/IEC 10646-1 Traditional Chinese
  18. $15: UTF-8 encoding of ISO/IEC 10646-1 Basic Multilingual Plane
  19. $16-$1F: Reserviert für zukünftige Nutzung

 

Control Codes für Einzelbyte Character Sets

  1. $80-$85: Reserviert für zukünftige Nutzung
  2. $86: character emphasis on
  3. $87: character emphasis off
  4. $88-$89: Reserviert für zukünfitge Nutzung
  5. $8A: CR/LF
  6. $8B-$9F: Nutzerdefiniert

Bei UTF-8 geht diesen control codes ein $C2 voran.

 

Fr_An - Letzte Änderung: 29. Januar 2010
Counter
seit 28. Juli 2010