РУССКИЙ МУЛЬТИКАНАЛЬНЫЙ ДИСКУРС
Главная Корпус Технические решения Принципы аннотации Публикации и доклады Поиск (beta)
ПРИНЦИПЫ АННОТАЦИИ (ОБНОВЛЕНО 10.12.2018)

При аннотировании корпуса осуществляются два вида разметки: основная и дополнительная. Основная разметка включает в себя аннотирование вокального компонента (вербальный и просодический каналы), жестов рук, жестов головы и окуломоторного канала. Вокальная аннотация состоит в членении речевого потока на значимые фрагменты (элементарные дискурсивные единицы — ЭДЕ, слова, заполненные и незаполненные паузы, неречевые звуки), а также в приписывании свойств ЭДЕ и отдельным их частям; для адекватного представления диалогических данных разработан специальный формат партитурной нотации. Для аннотирования жестов рук применяется новая оригинальная методика, основанная на сегментировании всего потока мануального кинетического поведения на периоды неподвижности и отдельные движения, которые затем формируют функциональные единицы — отдельные жесты, адапторы, смены позы, а также их группы. Для этих единиц затем указываются их характеристики — рукость жестов, фазовая структура, функциональный тип и т.д.  Аннотирование жестов головы основано на тех же принципах, которые были разработаны в рамках проекта для аннотирования мануальных жестов. В ходе аннотирования окуломоторного канала производится экспорт данных айтрекинга на видеосцену («наложение точки»), а также с помощью программы Tobii Pro Glasses Analyzer извлекаются данные о временной развертке всех фиксаций длительностью выше 100 мс, на которые потом в ручном режиме накладывается аннотационная схема с указанием на конкретное направление взора.

Дополнительная разметка включает в себя аннотирование жестов тела, мимики, проксемики, фонетическую транскрипцию, а также референциальную аннотацию, основу которой составляет разметка всех языковых выражений с конкретной референцией. С образцами основной и дополнительной разметок можно ознакомиться на вкладке «Корпус».

Для изучения того, как взаимодействуют между собой участники записи и как устроена координация между различными каналами коммуникации, удобно пользоваться единой мультиканальной аннотацией. В этом формате, выполненном в программе ELAN, одновременно учитываются вокальные, окуломоторные, цефалические и мануальные действия всех трех основных участников записи (подробнее см. в описании слоев мультиканальной аннотации). Ниже представлен пример такой аннотации, реализованный для диалогического фрагмента из 22-й записи. Для облегчения работы с фрагментом можно ознакомиться с технической инструкцией.

ОБРАЗЕЦ МУЛЬТИКАНАЛЬНОЙ АННОТАЦИИ
МедиафайлыАннотация
Pears22N-au-fragment.wav (7.2 MB) pears22N-mult-fragment.eaf (1.3 MB)
Pears22N-vi-fragment.avi (508 MB) pears22N-mult-fragment.pfsx (45 KB)
Pears22N-ey-fragment.avi (70 MB)  
Pears22W-vi-fragment.avi (194 MB)  
 
Скачать все файлы одним архивом (769 MB)
Написать письмо администратору