大象传媒

社会?文化

英文読解中の眼球运动を记録した大规模データセットを公开

研究イメージ画像
(Image by Namart Pieamsuwan/Shutterstock)
 文章を読む際の眼球運動を記録し、言語処理の研究に用いることは盛んに行われています。本研究では、日本語を母語とする英語学習者が文章を読解した際の眼球運動データを収集し、総計で約41万語以上に対する眼球運動データセットをTsukuba Eye-tracking Corpus (TECO)として構築?公開しました。

 言叶を処理する人间の过程は非常に复雑であり、これまで心理学や教育学の分野で人间の言语処理に関する多くの研究が行われてきました。特に书き言叶については、文章を読む际の眼球运动を记録する视线计测と呼ばれる方法が有用とされています。近年では、特にヨーロッパやその周辺地域の英语学习者について、母语や外国语での読解における眼球运动データを大规模に収集し、体系的に整理して公开する取り组みが盛んに行われています。しかしながら、これまで、日本语母语话者の英语による文章読解を対象としたものはありませんでした。

 本研究では、日本语母语话者の英文読解を対象に、総计41万语以上に対する眼球运动データセットを构筑?公开しました。本データセットは、日本语を母语とする大学生?大学院生41名が、英検準2级~準1级に相当する文章を読解した际の、1人あたり约1万语に対する眼球运动データから构成されています。これより、文章に含まれる各単语について、注视の回数、注视の継続时间、単语の読み飞ばしや読み戻りなどを示す、合计9つの指标を算出し、さまざまな分析を行ったところ、収集したデータの信頼性や妥当性が高いことが确认されました。

 本データセットは、Tsukuba Eye-tracking Corpus (TECO)としてオープンサイエンスのプラットフォームにて公開しています。文章理解や第二言語習得の研究だけでなく、自然言語処理やAI研究にも活用が可能であり、幅広い学術分野への波及効果が期待されます。

笔顿贵资料

プレスリリース

研究代表者

筑波大学人间系


掲载论文

【题名】
TECO: An Eye-tracking Corpus of Japanese L2 English Learners' Text Reading
(TECO: 日本語母語英語学習者による文章読解の視線計測コーパス)
【掲载誌】
Research Methods in Applied Linguistics
【顿翱滨】


PODCAST

インタビューのロングバージョンを、筑波大学笔辞诲肠补蝉迟でお聴きいただけます。

関连リンク