РУССКИЙ МУЛЬТИКАНАЛЬНЫЙ ДИСКУРС

ПРИНЦИПЫ АННОТАЦИИ (ОБНОВЛЕНО 10.12.2018)

При аннотировании корпуса осуществляются два вида разметки: основная и дополнительная. Основная разметка включает в себя аннотирование вокального компонента (вербальный и просодический каналы), жестов рук, жестов головы и окуломоторного канала. Вокальная аннотация состоит в членении речевого потока на значимые фрагменты (элементарные дискурсивные единицы — ЭДЕ, слова, заполненные и незаполненные паузы, неречевые звуки), а также в приписывании свойств ЭДЕ и отдельным их частям; для адекватного представления диалогических данных разработан специальный формат партитурной нотации. Для аннотирования жестов рук применяется новая оригинальная методика, основанная на сегментировании всего потока мануального кинетического поведения на периоды неподвижности и отдельные движения, которые затем формируют функциональные единицы — отдельные жесты, адапторы, смены позы, а также их группы. Для этих единиц затем указываются их характеристики — рукость жестов, фазовая структура, функциональный тип и т.д. Аннотирование жестов головы основано на тех же принципах, которые были разработаны в рамках проекта для аннотирования мануальных жестов. В ходе аннотирования окуломоторного канала производится экспорт данных айтрекинга на видеосцену («наложение точки»), а также с помощью программы Tobii Pro Glasses Analyzer извлекаются данные о временной развертке всех фиксаций длительностью выше 100 мс, на которые потом в ручном режиме накладывается аннотационная схема с указанием на конкретное направление взора.

Дополнительная разметка включает в себя аннотирование жестов тела, мимики, проксемики, фонетическую транскрипцию, а также референциальную аннотацию, основу которой составляет разметка всех языковых выражений с конкретной референцией. С образцами основной и дополнительной разметок можно ознакомиться на вкладке «Корпус».

Для изучения того, как взаимодействуют между собой участники записи и как устроена координация между различными каналами коммуникации, удобно пользоваться единой мультиканальной аннотацией. В этом формате, выполненном в программе ELAN, одновременно учитываются вокальные, окуломоторные, цефалические и мануальные действия всех трех основных участников записи (подробнее см. в описании слоев мультиканальной аннотации). Ниже представлен пример такой аннотации, реализованный для диалогического фрагмента из 22-й записи. Для облегчения работы с фрагментом можно ознакомиться с технической инструкцией.

ОБРАЗЕЦ МУЛЬТИКАНАЛЬНОЙ АННОТАЦИИ

Аудиофайлы	Видеофайлы	Файлы с айтрекеров	Аннотация
Pears22N-au-fragment.wav (7.3 MB)	Pears22N-vi-fragment.avi (516.9 MB)	Pears22N-ey-fragment.avi (69.9 MB)	Pears22-mult-fragment.eaf (2.5 MB)
Pears22R-au-fragment.wav (7.3 MB)	Pears22R-vi-fragment.avi (838.9 MB)	Pears22R-ey-fragment.avi (86.7 MB)	Pears22-mult-fragment.pfsx (92 KB)
Pears22C-au-fragment.wav (7.3 MB)	Pears22C-vi-fragment.avi (444.8 MB)
	Pears22W-vi-fragment.avi (200.6 MB)

Скачать все файлы одним архивом (2.1 GB)