LREC 2020 - Accepted Papers

ID	Title	Authors
2	Neural Mention Detection	Juntao Yu, Bernd Bohnet and Massimo Poesio
4	AIDATATANG_1505ZH: A Large-Scale Chinese Speech Corpus for Deep Learning	Liyuan Wang, Daliang Wang, Hongwei Qi and Hongling He
5	A Survey on Natural Language Processing for Fake News Detection	Ray Oshikawa, Jing Qian and William Yang Wang
8	Diverging Divergences: Examining Variants of Jensen Shannon Divergence for Corpus Comparison Tasks	Jinghui Lu, Maeve Henchion and Brian Mac Namee
9	Multi-class Multilingual Classification of Wikipedia Articles Using Extended Named Entity Tag Set	Hassan S. Shavarani and Satoshi Sekine
11	Abstractive Document Summarization without Parallel Data	Nikola Nikolov and Richard Hahnloser
12	Construct a Sense-Frame Aligned Predicate Lexicon for Chinese AMR Corpus	Li Song, Yuling Dai, Yihuan Liu, Bin Li and Weiguang QU
14	An Algerian Corpus and an Annotation Platform for Opinion and Emotion Analysis	Leila Moudjari and Karima Akli-Astouati
15	Evaluation of Sentence Representations in Polish	Sławomir Dadas, Michał Perełkiewicz and Rafał Poświata
16	A Framework for Evaluation of Machine Reading Comprehension Gold Standards	Viktor Schlegel, Marco Valentino, Andre Freitas, Goran Nenadic and Riza Batista-Navarro
17	Detecting Negation Cues and Scopes in Spanish	Salud María Jiménez-Zafra, Roser Morante, Eduardo Blanco, María Teresa Martín Valdivia and L. Alfonso Ureña López
19	What Comes First: Combining Motion Capture and Eye tracking Data to Study the Order of Articulators in Constructed Action in Sign Language Narratives	Tommi Jantunen, Anna Puupponen and Birgitta Burger
20	Introducing RONEC - the Romanian Named Entity Corpus	Stefan Daniel Dumitrescu and Andrei-Marius Avram
21	LibriVoxDeEn: A Corpus for German-to-English Speech Translation and Speech Recognition	Benjamin Beilharz, Xin Sun, Sariya Karimova and Stefan Riezler
23	Headword-Oriented Entity Linking: A New Entity Linking Task with Dataset and Baseline	Mu Yang, Chi-Yen Chen, Yi-Hui Lee, Qian-hui Zeng and Wei-Yun Ma
26	Syntax and Semantics in a Treebank for Esperanto	Eckhard Bick
28	Implementation and Evaluation of an LFG-based Parser for Wolof	Cheikh M. Bamba Dione
30	Automatic Transcription Challenges for Inuktitut, a Low-Resource Polysynthetic Language	Vishwa Gupta and Gilles Boulianne
32	MucLex: A German Lexicon for Surface Realisation	Kira Klimt, Daniel Braun, Daniela Schneider and Florian Matthes
33	DiscSense: Automated Semantic Analysis of Discourse Markers	Damien Sileo, Tim Van de Cruys, Camille Pradel and Philippe Muller
36	A Penn-style Treebank of Middle Low German	Hannah Booth, Anne Breitbarth, Aaron Ecay and Melissa Farasyn
37	Transfer Learning from Transformers to Fake News Challenge Stance Detection (FNC-1) Task	Valeriya Slovikovskaya
38	The Treebank of Vedic Sanskrit	Oliver Hellwig, Salvatore Scarlata, Elia Ackermann and Paul Widmer
39	Scientific Statement Classification over arXiv.org	Deyan Ginev and Bruce R Miller
40	A Large Harvested Corpus of Location Metonymy	Kevin Alex Mathews and Michael Strube
43	MaSS: A Large and Clean Multilingual Corpus of Sentence-aligned Spoken Utterances Extracted from the Bible	Marcely Zanon Boito, William Havard, Mahault Garnerin, Éric Le Ferrand and Laurent Besacier
44	The DAPRECO knowledge base: representing the GDPR in LegalRuleML	Livio Robaldo, Cesare Bartolini and Gabriele Lenzini
46	Books of Hours. The First Liturgical Data Set for Text Segmentation.	Amir Hazem, Beatrice Daille, Christopher Kermorvant and Dominique Stutzmann
47	Burmese Speech Corpus, Finite-State Text Normalization and Pronunciation Grammars with an Application to Text-to-Speech	Yin May Oo, Theeraphol Wattanavekin, Chenfang Li, Pasindu De Silva, Supheakmungkol Sarin, Knot Pipatsrisawat, Martin Jansche, Oddur Kjartansson and Alexander Gutkin
51	Open-source Multi-speaker Speech Corpora for Building Gujarati, Kannada, Malayalam, Marathi, Tamil and Telugu Speech Synthesis Systems	Fei He, Shan-Hui Cathy Chu, Oddur Kjartansson, Clara Rivera, Anna Katanova, Alexander Gutkin, Isin Demirsahin, Cibu Johny, Martin Jansche, Supheakmungkol Sarin and Knot Pipatsrisawat
52	Adjusting Image Attributes of Localized Regions with Low-level Dialogue	Tzu-Hsiang Lin, Alexander Rudnicky, Trung Bui, Doo Soon Kim and Jean Oh
53	Alignment Annotation for Clinic Visit Dialogue to Clinical Note Sentence Language Generation	Wen-wai Yim, Meliha Yetisgen, Jenny Huang and Micah Grossman
55	Geographically-Balanced Gigaword Corpora for 50 Language Varieties	Jonathan Dunn and Ben Adams
58	Crowdsourcing Latin American Spanish for Low-Resource Text-to-Speech	Adriana Guevara-Rukoz, Isin Demirsahin, Fei He, Shan-Hui Cathy Chu, Supheakmungkol Sarin, Knot Pipatsrisawat and Alexander Gutkin
60	An Enhanced Mapping Scheme of the Universal Part-Of-Speech for Korean	Myung Hee Kim and Nathalie Colineau
61	The Universal Decompositional Semantics Dataset and Decomp Toolkit	Aaron Steven White, Elias Stengel-Eskin, Siddharth Vashishtha, Venkata Subrahmanyan Govindarajan, Dee Ann Reisinger, Tim Vieira, Keisuke Sakaguchi, Sheng Zhang, Francis Ferraro, Rachel Rudinger, Kyle Rawlins and Benjamin Van Durme
65	GameWikiSum: a Novel Large Multi-Document Summarization Dataset	Diego Antognini and Boi Faltings
66	Data Augmentation through Machine Translation for Fake News Detection in the Urdu Language	Maaz Amjad, Grigori Sidorov and Alisa Zhila
67	RP-DNN: A Tweet level propagation context based deep neural networks for early rumor detection in Social Media	JIE GAO, Sooji Han, Xingyi Song and Fabio Ciravegna
68	Corpus of Chinese Dynastic Histories: Gender Analysis over Two Millennia	Sergey Zinin and Yang Xu
69	Are Word Embeddings Really a Bad Fit for the Estimation of Thematic Fit?	Emmanuele Chersoni, Ludovica Pannitto, Enrico Santus, Alessandro Lenci and Chu-Ren Huang
70	Issues and Perspectives from 10,000 Annotated Financial Social Media Data	Chung-Chi Chen, Hen-Hsen Huang and Hsin-Hsi Chen
71	CCNet: Extracting High Quality Monolingual Datasets from Web Crawl Data	Guillaume Wenzek, Marie-Anne Lachaux, Alexis Conneau, Vishrav Chaudhary, Francisco Guzmán, Armand Joulin and Edouard Grave
72	TIARA: A Tool for Annotating Discourse Relations and Sentence Reordering	Jan Wira Gotama Putra, Simone Teufel, Kana Matsumura and Takenobu Tokunaga
73	MultiWOZ 2.1: A Consolidated Multi-Domain Dialogue Dataset with State Corrections and State Tracking Baselines	Mihail Eric, Rahul Goel, Shachi Paul, Abhishek Sethi, Sanchit Agarwal, Shuyang Gao, Adarsh Kumar, Anuj Goyal, Peter Ku and Dilek Hakkani-Tur
74	EmoEvent: A multilingual emotion corpus based on different events	Flor Miriam Plaza del Arco, Carlo Strapparava, L. Alfonso Urena Lopez and Maite Martin
75	Identification of primary and collateral tracks in stuttered speech	Rachid Riad, Anne-Catherine Bachoud-Lévi, Frank Rudzicz and Emmanuel Dupoux
76	SEDAR: a Large Scale French-English Financial Domain Parallel Corpus	Abbas Ghaddar and Phillippe Langlais
77	TopicNet: Making Additive Regularisation for Topic Modelling Accessible	Victor Bulatov, Vasiliy Alekseev, Konstantin Vorontsov, Darya Polyudova, Eugenia Veselova, Alexey Goncharov and Evgeny Egorov
78	MultiMWE: Building a Multi-lingual Multi-Word Expression (MWE) Parallel Corpora	LIFENG HAN, Gareth Jones and Alan Smeaton
79	Finite State Machine Pattern-Root Arabic Morphological Generator, Analyzer and Diacritizer	Maha Alkhairy, Afshan Jafri and David Smith
80	Cross-domain Author Gender Classification in Brazilian Portuguese	Rafael Dias and Ivandré Paraboni
83	Searching Brazilian Twitter for signs of mental health issues	Wesley Santos, Amanda Funabashi and Ivandré Paraboni
85	TableBank: Table Benchmark for Image-based Table Detection and Recognition	Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou and Zhoujun Li
86	A Myanmar (Burmese)-English Named Entity Transliteration Dictionary	AYE MYAT MON, Chenchen Ding, Hour Kaing, KHIN MAR SOE, Masao Utiyama and Eiichiro Sumita
88	Affection Driven Neural Networks for Sentiment Analysis	Rong Xiang, Yunfei Long, Mingyu Wan, Jinghang Gu, Qin Lu and Chu-Ren Huang
89	WIKIR: A Python toolkit for building a large-scale Wikipedia-based English Information Retrieval Dataset	Jibril Frej, Didier Schwab and Jean-Pierre Chevallet
90	Evaluation of Greek Word Embeddings	Stamatis Outsios, Christos Karatsalos, Konstantinos Skianis and Michalis Vazirgiannis
91	Predicting Multidimensional Subjective Ratings of Children’ Readings from the Speech Signals for the Automatic Assessment of Fluency	Gérard Bailly, Erika Godde, Anne-Laure Piat-Marchand and Marie-Line Bosse
93	JParaCrawl: A Large Scale Web-Based English-Japanese Parallel Corpus	Makoto Morishita, Jun Suzuki and Masaaki Nagata
95	CA-EHN: Commonsense Analogy from E-HowNet	Peng-Hsuan Li, Tsan-Yu Yang and Wei-Yun Ma
97	SiBert: Enhanced Chinese Pre-trained Language Model with SentenceInsertion	Jiahao Chen, Chenjie Cao and Xiuyan Jiang
98	Infrastructure for Semantic Annotation in the Genomics Domain	Mahmoud El-Haj, Nathan Rutherford, Matthew Coole, Ignatius Ezeani, Sheryl Prentice, Nancy Ide, Jo Knight, Scott Piao, John Mariani, Paul Rayson and Keith Suderman
99	Building Semantic Grams of Human Knowledge	Valentina Leone, Giovanni Siragusa, Luigi Di Caro and Roberto Navigli
100	LEDGAR: A Large-Scale Multi-label Corpus for Text Classification of Legal Provisions in Contracts	Don Tuggener, Pius von Däniken, Thomas Peetz and Mark Cieliebak
101	Evaluating and Improving Child-Directed Automatic Speech Recognition	Eric Booth, Jake Carns, Casey Kennington and Nader Rafla
102	Metaphorical Expressions in Automatic Arabic Sentiment Analysis	Israa Alsiyat and Scott Piao
104	The Royal Society Corpus 6.0: Providing 300+ Years of Scientific Writing for Humanistic Study	Stefan Fischer, Jörg Knappen, Katrin Menzel and Elke Teich
105	Ciron: a New Benchmark Dataset for Chinese Irony Detection	Rong Xiang, Xuefeng Gao, Yunfei Long, Anran Li, Emmanuele Chersoni, Qin Lu and Chu-Ren Huang
106	Multi-class Hierarchical Question Classification for Multiple Choice Science Exams	Dongfang Xu, Peter Jansen, Jaycie Martin, Zhengnan Xie, Vikas Yadav, Harish Tayyar Madabushi, Oyvind Tafjord and Peter Clark
107	Constructing a Public Meeting Corpus	Koji Tanaka, Chenhui Chu, Haolin Ren, Benjamin Renoust, Yuta Nakashima, Noriko Takemura, Hajime Nagahara and Takao Fujikawa
109	How to Compare Automatically Two Phonological Strings: Application to Intelligibility Measurement in the Case of Atypical Speech	Alain Ghio, muriel lalain, Laurence Giusti, Corinne Fredouille and Virginie Woisard
113	On the Robustness of Unsupervised and Semi-supervised Cross-lingual Word Embedding Learning	Yerai Doval, Jose Camacho-Collados, Luis Espinosa Anke and Steven Schockaert
115	A Dataset of Mycenaean Linear B Sequences	Katerina Papavassiliou, Gareth Owens and Dimitrios Kosmopoulos
117	An unsupervised method for weighting finite-state morphological analyzers	Amr Keleg, Francis Tyers, Nick Howell and Tommi Pirinen
119	MuSE: a Multimodal dataset of Stressed Emotion	Mimansa Jaiswal, Cristian-Paul Bara, Yuanhang Luo, Mihai Burzo, Rada Mihalcea and Emily Mower Provost
120	Construction of an Evaluation Corpus for Grammatical Error Correction for Learners of Japanese as a Second Language	Aomi Koyama, Tomoshige Kiyuna, Kenji Kobayashi, Mio Arai and Mamoru Komachi
121	Semi-supervised Development of ASR Systems for Multilingual Code-switched Speech in Under-resourced Languages	Astik Biswas, Emre Yilmaz, Febe De Wet, Ewald Van der westhuizen and Thomas Niesler
123	Discourse Component to Sentence (DC2S): An Efficient Human-Aided Construction of Paraphrase and Sentence Similarity Dataset	Won Ik Cho, Jong In Kim, Young Ki Moon and Nam Soo Kim
130	Typographical Error Generation using Real-World Statistics	Kshitij Shah and Gerard de Melo
132	A Manually Annotated Resource for the Investigation of Nasal Grunts	Nicolas Ballier
133	The Objective and Subjective Sleepiness Voice Corpora	Vincent P. Martin, Jean-Luc Rouas, Jean-Arthur Micoulaud Franchi and Pierre Philip
135	A Comparison of Explicit and Implicit Proactive Dialogue Strategies for Conversational Recommendation	Matthias Kraus, Fabian Fischbach, Pascal Jensen and Wolfgang Minker
136	Corpus REDEWIEDERGABE	Annelen Brunner, Stefan Engelberg, Fotis Jannidis, Ngoc Duyen Tanja Tu and Lukas Weimer
137	A Domain-Specific Dataset of Difficulty Ratings for German Noun Compounds in the Domains DIY, Cooking and Automotive	Julia Bettinger, Anna Hätty, Michael Dorna and Sabine Schulte im Walde
138	Developing an Arabic Infectious Disease Ontology with Non-Standard Terminology	Lama Alsudias and Paul Rayson
141	Summarization Corpora of Wikipedia Articles	Dominik Frefel
142	A Cluster Ranking Model for Full Anaphora Resolution	Juntao Yu, Alexandra Uma and Massimo Poesio
143	Inherent Dependency Displacement Bias of Transition-Based Algorithms	Mark Anderson and Carlos Gómez-Rodríguez
145	The Nunavut Hansard Inuktitut-English Parallel Corpus 3.0 with Preliminary Machine Translation Results	Eric Joanis, Rebecca Knowles, Roland Kuhn, Samuel Larkin, Patrick Littell, Chi-kiu Lo, Darlene Stewart and Jeffrey Micher
149	Neural Machine Translation for Low-Resourced Indian Languages	Himanshu Choudhary, Shivansh Rao and Rajesh Rohilla
151	Assessing Users’ Reputations from Syntactic and Semantic Information in Community Question Answering	Yonas Woldemariam
152	Processing South Asian languages written in the Latin script: the Dakshina dataset	Brian Roark, Lawrence Wolf-Sonkin, Christo Kirov, Sebastian J. Mielke, Cibu Johny, Isin Demirsahin and Keith Hall
154	Evaluating Text Coherence at Sentence and Paragraph Levels	Sennan Liu, Shuang Zeng and Sujian Li
155	Realistic Textual Entailment Corpus	Yuta Hayashibe
156	Effective Crowdsourcing of Multiple Tasks for Comprehensive Knowledge Extraction	Sangha Nam, Minho Lee, Donghwan Kim, Kijong Han, Kuntae Kim, Sooji Yoon, Eun-kyung Kim and KEY-SUN CHOI
157	Unsupervised Domain Adaptation of Language Models for Reading Comprehension	Kosuke Nishida, Kyosuke Nishida, Itsumi Saito, Hisako Asano and Junji Tomita
159	Annotating and Extracting Synthesis Process of All-Solid-State Batteries from Scientific Literature	Fusataka Kuniyoshi, Kohei Makino, Jun Ozawa and Makoto Miwa
161	Content-Equivalent Translated Parallel News Corpus and Extension of Domain Adaptation for NMT	Hideya Mino, Hitosh Ito, Isao Goto, Ichiro Yamada, Hideki Tanaka and Takenobu Tokunaga
163	Exploring Bilingual Word Embeddings for Hiligaynon, a Low-Resource Language	Leah Michel, Viktor Hangya and Alexander Fraser
165	Parallel Corpus for Japanese Spoken-to-Written Style Conversion	Mana Ihori, Akihiko Takashima and Ryo Masumura
167	Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque	Arantxa Otegi, Aitor Agirre, Jon Ander Campos, Aitor Soroa and Eneko Agirre
168	Language-Independent Tokenisation Rivals Language-Specific Tokenisation for Word Similarity Prediction	Danushka Bollegala, Ryuichi Kiryo, Kosuke Tsujino and Haruki Yukawa
170	Open-source Multi-speaker Corpora of the English Accents in the British Isles	Isin Demirsahin, Oddur Kjartansson and Alexander Gutkin
172	Improving the precision of natural textual entailment problem datasets	Jean-Philippe Bernardy and Stergios Chatzikyriakidis
173	A Semi-supervised Approach for De-identification of Swedish Clinical Text	Hanna Berg and Hercules Dalianis
175	Comparative Study of Sentence Embeddings for Contextual Paraphrasing	Louisa Pragst, Wolfgang Minker and Stefan Ultes
176	Multi-Staged Cross-Lingual Acoustic Model Adaption for Robust Speech Recognition in Real-World Applications - A Case Study on German Oral History Interviews	Michael Gref, Oliver Walter, Christoph Schmidt, Sven Behnke and Joachim Köhler
177	HotelRec: a Novel Very Large-Scale Hotel Recommendation Dataset	Diego Antognini and Boi Faltings
178	Humans Keep It One Hundred: an Overview of AI Journey	Tatiana Shavrina, Anton Emelyanov, Alena Fenogenova, Vadim Fomin, Vladislav Mikhailov, Andrey Evlampiev, Valentin Malykh, Vladimir Larin, Alex Natekin, Aleksandr Vatulin, Peter Romov, Daniil Anastasiev, Nikolai Zinov and Andrey Chertok
179	LSF-ANIMAL: A Motion Capture Corpus in French Sign Language designed for the Animation of Signing Avatars	Lucie Naert, Caroline Larboulette and Sylvie Gibet
180	Automatically Building a Multilingual Lexicon of False Friends With No Supervision	Ana-Sabina Uban and Liviu P. Dinu
181	Doctor Who? Framing Through Names and Titles in German	Esther van den Berg, Katharina Korfhage, Josef Ruppenhofer, Michael Wiegand and Katja Markert
182	Building an English-Chinese Parallel Corpus Annotated with Sub-sentential Translation Techniques	Yuming Zhai, Lufei Liu, Xinyi Zhong, Gbariel Illouz and Anne Vilnat
183	ThemePro: A Toolkit for the Analysis of Thematic Progression	Monica Dominguez, Juan Soler and Leo Wanner
184	Universal Dependencies v2: An Evergrowing Multilingual Treebank Collection	Joakim Nivre, Marie-Catherine de Marneffe, Filip Ginter, Jan Hajic, Christopher D. Manning, Sampo Pyysalo, Sebastian Schuster, Francis Tyers and Daniel Zeman
185	HardEval: Focusing on Challenging Tokens to Assess Robustness of NER	Gabriel Bernier-Colborne and Phillippe Langlais
186	A Finite-State Morphological Analyser for Evenki	Anna Zueva, Anastasia Kuznetsova and Francis Tyers
187	Propagate-Selector: Detecting Supporting Sentences for Question Answering via Graph Neural Networks	Seunghyun Yoon, Franck Dernoncourt, Doo Soon Kim, Trung Bui and Kyomin Jung
189	WEXEA: Wikipedia EXhaustive Entity Annotation	Michael Strobl, Amine Trabelsi and Osmar Zaiane
191	An Empirical Comparison of Question Classification Methods for Question Answering Systems	Eduardo Cortes, Vinicius Woloszyn, Arne Binder, Tilo Himmelsbach, Dante Barone and Sebastian Möller
194	EMPAC	Iris Serrat Roozen and José Manuel Martínez Martínez
196	NMT and PBSMT Error Analyses in English to Brazilian Portuguese Automatic Translations	Helena Caseli and Marcio Inácio
198	Constructing multimodal language learner texts using LARA: experiences with nine languages	Elham Akhlaghi, Branislav Bédi, Fatih Bektaş, Harald Berthelsen, Matthias Butterweck, Cathy Chua, Catia Cucchiarin, Gülşen Eryiğit, Johanna Gerlach, Hanieh Habibi, Neasa Ní Chiaráin, Manny Rayner, Steinþór Steingrímsson and Helmer Strik
199	Online Near-Duplicate Detection of News Articles	Simon Rodier and Dave Carter
200	KidSpell: A Child-Oriented, Rule-Based, Phonetic Spellchecker	Brody Downs, Oghenemaro Anuyah, Aprajita Shukla, Jerry Alan Fails, Sole Pera, Katherine Wright and Casey Kennington
202	The Alice Datasets: fMRI & EEG Observations of Natural Language Comprehension	Shohini Bhattasali, Jonathan Brennan, Wen-Ming Luh, Berta Franzluebber and John Hale
204	ThaiLMCut: Character Embeddings for Thai Word Segmentation	Suteera Seeha, Ivan Bilan, Liliana Mamani Sanchez, Johannes Huber, Michael Matuschek and Hinrich Schütze
206	Evaluation Dataset for Zero Pronoun in Japanese to English Translation	Sho Shimadu, Sho Takase, Toshiaki Nakazawa and Naoaki Okazaki
207	Generating Major Types of Chinese Classical Poetry in a Uniformed Framework	Jinyi Hu and Maosong Sun
208	Automated Essay Scoring System for Nonnative Japanese Learners	Reo Hirao, Mio Arai, Hiroki Shimanaka, Satoru Katsumata and Mamoru Komachi
211	A Dataset for Investigating the Impact of Feedback on Student Revision Outcome	Ildiko Pilan, John Lee, Chak Yan Yeung and Jonathan Webster
212	Cross-Lingual Word Embeddings for Turkic Languages	Elmurod Kuriyozov, Yerai Doval and Carlos Gómez-Rodríguez
215	Time-Aware Word Embeddings for Three Lebanese News Archives	Jad Doughman, Fatima Abu Salem and Shady Elbassuoni
216	Construction and Analysis of a Multimodal Chat-talk Corpus for Dialog Systems Considering Interpersonal Closeness	Yoshihiro Yamazaki, Yuya Chiba, Takashi Nose and Akinori Ito
217	CCOHA: Clean Corpus of Historical American English	Reem Alatrash, Dominik Schlechtweg and Sabine Schulte im Walde
218	Morphology-rich Alphasyllabary Embeddings	Amanuel Mersha and Stephen Wu
219	A Real-World Data Resource of Complex Sensitive Sentences Based on Documents from the Monsanto Trial	Jan Neerbek, Morten Eskildsen, Peter Dolog and Ira Assent
220	Adapt or Get Left Behind: Domain Adaptation through BERT Language Model Finetuning for Aspect-Target Sentiment Classification	Alexander Rietzler, Sebastian Stabinger, Paul Opitz and Stefan Engl
221	Localization of Fake News Detection via Multitask Transfer Learning	Jan Christian Blaise Cruz, Julianne Agatha Tan and Charibeth Cheng
222	WeDH - a Friendly Tool for Building Literary Corpora Enriched with Encyclopedic Metadata	Mattia Egloff and Davide Picca
223	CLFD: A Novel Vectorization Technique and Its Application in Fake News Detection	Michail Mersinias, Stergos Afantenos and Georgios Chalkiadakis
224	GM-RKB WikiText Error Correction Task and Baselines	Gabor Melli, Abdelrhman Eldallal, Bassim Lazem and Olga Moreira
225	A Parallel WordNet for English, Swedish and Bulgarian	Krasimir Angelov
227	Machine-Aided Annotation for Fine-Grained Proposition Types in Argumentation	Yohan Jo, Elijah Mayfield, Chris Reed and Eduard Hovy
228	BLISS: An Agent for Collecting Spoken Dialogue data about Health and Well-being	Jelte van Waterschoot, Iris Hendrickx, Arif Khan, Esther Klabbers, Marcel de Korte, Helmer Strik, Catia Cucchiarini and Mariët Theune
229	Evaluating Sentence Segmentation in Different Datasets of Neuropsychological Language Tests in Brazilian Portuguese	Edresson Casanova, Marcos Treviso, Lilian Hübner and Sandra Aluísio
235	TV-AfD: An Imperative-Annotated Corpus from The Big Bang Theory and Wikipedia’s Articles for Deletion Discussions	Yimin Xiao, Zong-Ying Slaton and Lu Xiao
236	The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset for E-commerce Customer Service	Meng Chen, Ruixue Liu, Lei Shen, Shaozu Yuan, Jingyan Zhou, Youzheng Wu, Xiaodong He and Bowen Zhou
237	Chinese Discourse Parsing: Model and Evaluation	Lin Chuan-An, Shyh-Shiun Hung, Hen-Hsen Huang and Hsin-Hsi Chen
238	Jejueo Datasets for Machine Translation and Speech Synthesis	Kyubyong Park, Yo Joong Choe and Jiyeon Ham
239	A Linguistic View of Online Restaurant Reviews	Hyun Jung KANG and Iris Eshkol-Taravella
240	Creating Corpora for Research in Feedback Comment Generation	Ryo Nagata, Kentaro Inui and Shin'ichiro Ishikawa
241	Outbound Translation User Interface Ptakopet: A Pilot Study	Vilém Zouhar and Ondřej Bojar
242	Shallow Discourse Annotation for Chinese TED Talks	Wanqiu Long, Xinyi Cai, James Reid, Bonnie Webber and Deyi Xiong
243	An Evaluation Dataset for Identifying Communicative Functions of Sentences in English Scholarly Papers	Kenichi Iwatsuki, Florian Boudin and Akiko Aizawa
244	A Supervised Part-Of-Speech Tagger for the Greek Language of the Social Web	Maria Nefeli Nikiforos and Katia Lida Kermanidis
248	A Chinese Corpus for Fine-grained Entity Typing	Chin Lee, Hongliang Dai, Yangqiu Song and Xin Li
249	Modelling Narrative Elements in a Short Fiction Story: a Study on Annotation Schemes and Guidelines	Elena Mikhalkova, Timofei Protasov, Polina Sokolova, Anastasiya Bashmakova and Anastasiya Drozdova
251	GGP: Glossary Guided Post-processing for Word Embedding Learning	Ruosong Yang, Jiannong Cao and Zhiyuan Wen
254	Discovering Biased News Articles Leveraging Multiple Human Annotations	Konstantina Lazaridou, Alexander Löser, Maria Mestre and Felix Naumann
255	RedDust: a Large Reusable Dataset of Reddit User Traits	Anna Tigunova, Paramita Mirza, Andrew Yates and Gerhard Weikum
256	Towards Data-driven Ontologies: a Filtering Approach using Keywords and Natural Language Constructs	Maaike de Boer and Jack P. C. Verhoosel
257	A Large Scale Speech Sentiment Corpus	Eric Chen, Zhiyun Lu, Hao Xu, Liangliang Cao, Yu Zhang and James Fan
258	Bag & Tag'em - A new Dutch Stemmer	Anne Jonker, Corné de Ruijt and Jornt de Gruijl
259	Resources in Underrepresented Languages: Building a Representative Romanian Corpus	Ludmila Ciochina-Midrigan and David P. Corina
260	Cortical Speech Databases For Deciphering the Articulatory Code	Harald Höge
263	A Gold Standard Dependency Treebank for Turkish	Tolga Kayadelen, Adnan Ozturel and Bernd Bohnet
265	Affect inTweets: A Transfer Learning Approach	Linrui Zhang, Hsin-Lun Huang, Yang Yu and Dan Moldovan
267	An Annotated Social Media Corpus for German	Eckhard Bick
269	Manovaad: A Novel Approach to Event Oriented Corpus Creation Capturing Subjectivity and Focus	Lalitha Kameswari and Radhika Mamidi
270	HypoNLI: Exploring the Artificial Patterns of Hypothesis-only Bias in Natural Language Inference	Tianyu Liu, Zheng Xin, Baobao Chang and Zhifang Sui
274	KGvec2go – Knowledge Graph Embeddings as a Service	Jan Portisch, Michael Hladik and Heiko Paulheim
275	Chunk Different Kind of Spoken Discourse: Challenges for Machine Learning	Iris Eshkol-Taravella, Mariame Maarouf, Marie Skrovec and Flora Badin
276	Serial Speakers: a Dataset of TV Series	Xavier BOST, Vincent Labatut and Georges Linares
277	Sign Language Recognition with Transformer Networks	Mathieu De Coster, Mieke Van Herreweghe and Joni Dambre
280	Czech Historical Named Entity Corpus v 1.0	Helena Hubková, Pavel Kral and Eva Pettersson
281	Mandarinograd: A Chinese Collection of Winograd Schemas	Timothée Bernard and Ting Han
286	An Automatic Tool For Language Evaluation	Fabio Fassetti and Ilaria Fassetti
288	How Universal are Universal Dependencies? Exploiting Syntax for Multilingual Clause-level Sentiment Detection	Hiroshi Kanayama and Ran Iwamoto
290	Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language	Kohei Matsuura, Sei Ueno, Masato Mimura, Shinsuke Sakai and Tatsuya Kawahara
292	Better together: modern methods plus traditional thinking in NP alignment	Ádám Kovács, Judit Ács, Andras Kornai and Gábor Recski
294	Corpora and Baselines for Humour Recognition in Portuguese	Hugo Gonçalo Oliveira, André Clemêncio and Ana Alves
297	Handling Entity Normalization with no Annotated Corpus: Weakly Supervised Methods Based on Distributional Representation and Ontological Information	Arnaud Ferré, Robert Bossy, Mouhamadou Ba, Louise Deléger, Thomas Lavergne, Pierre Zweigenbaum and Claire Nédellec
298	The Discussion Tracker Corpus of Collaborative Argumentation	Christopher Olshefski, Luca Lugini, Ravneet Singh, Diane Litman and Amanda Godley
299	FactCorp: A Corpus of Dutch Fact-checks and its Multiple Usages	Marten van der Meulen and W. Gudrun Reijnierse
301	CodE Alltag 2.0 — A Pseudonymized German-Language Email Corpus	Elisabeth Eder, Ulrike Krieg-Holz and Udo Hahn
302	"Cheese!": a corpus of face-to-face French interactions. A case study for analyzing smiling and conversational humor	Béatrice Priego-Valverde, Brigitte BIGI and Mary Amoyal
304	Multilingual Culture-Independent Word Analogy Datasets	Matej Ulčar, Marko Robnik-Šikonja, Kristiina Vaik, Jessica Lindström and Milda Dailidėnaitė
305	Which Evaluations Uncover Sense Representations that Actually Make Sense?	Jordan Boyd-Graber, Fenfei Guo, Leah Findlater and Mohit Iyyer
308	Automatic Section Recognition in Obituaries	Valentino Sabbatino, Laura Ana Maria Bostan and Roman Klinger
311	Embedding Space Correlation as a Measure of Domain Similarity	Anne Beyer, Göran Kauermann and Hinrich Schütze
312	High Quality ELMo Embeddings for Seven Less-Resourced Languages	Matej Ulčar and Marko Robnik-Šikonja
314	Seshat: A tool for managing and verifying annotation campaigns of audio data	Hadrien Titeux, Rachid Riad, Xuan-Nga Cao, Nicolas Hamilakis, Kris Madden, Alejandrina Cristia, Anne-Catherine Bachoud-Lévi and Emmanuel Dupoux
316	Dragonfly: Advances in Non-Speaker Annotation for Low Resource Languages	Cash Costello, Shelby Anderson, Caitlyn Bishop, James Mayfield and Paul McNamee
317	ENGLAWI: From Human- to Machine-Readable Wiktionary	Franck Sajous, Basilio Calderone and Nabil Hathout
318	Shallow Discourse Parsing for Under-Resourced Languages: Combining Machine Translation and Annotation Projection	Henny Sluyter-Gäthje, Peter Bourgonje and Manfred Stede
320	SegBo: A Database of Borrowed Sounds in the World’s Language	Eitan Grossman, Elad Eisen, Dmitry Nikolaev and Steven Moran
321	ZuCo 2.0: A Dataset of Physiological Recordings During Natural Reading and Annotation	Nora Hollenstein, Marius Troendle, Ce Zhang and Nicolas Langer
322	Cross-sentence pre-trained model for Interactive QA matching	Jinmeng Wu and Yanbin Hao
323	Automatic Orality Identification in Historical Texts	Katrin Ortmann and Stefanie Dipper
324	Natural Language Processing Pipeline to Annotate Bulgarian Legislative Documents	Svetla Koeva, Nikola Obreshkov and Martin Yalamov
325	GeBioToolkit: Automatic Extraction of Gender-Balanced Multilingual Corpus of Wikipedia Biographies	Marta R. Costa-jussà, Pau Li Lin and Cristina España-Bonet
328	CLDFBench: Give Your Cross-Linguistic Data a Lift	Robert Forkel and Johann-Mattis List
329	Development of a Guarani - Spanish Parallel Corpus	Luis Chiruzzo, Pedro Amarilla, Adolfo Ríos and Gustavo Giménez Lugo
330	SimplifyUR: Unsupervised Lexical Text Simplification for Urdu	Namoos Hayat Qasmi, Haris Bin Zia, Awais Athar and Agha Ali Raza
332	Developing Resources for Automated Speech Processing of Quebec French	Mélanie Lancien, Marie-Hélène Côté and Brigitte BIGI
334	A Dataset of German Legal Documents for Named Entity Recognition	Elena Leitner, Georg Rehm and Julian Moreno-Schneider
335	Annotating a Fable in Italian Sign Language (LIS)	Serena Trolvi and Rodolfo Delmonte
336	KonText: Advanced and Flexible Corpus Query Interface	Tomáš Machálek
337	Word at a Glance: Modular Word Profile Aggregator	Tomáš Machálek
338	A Corpus of Encyclopedia Articles with Logical Forms	Nathan Rasmussen and William Schuler
342	Ontology Matching Using Convolutional Neural Networks	Michel Gagnon and Amal Zouaq
343	HBCP Corpus: A New Resource for the Analysis of Behavioural Change Intervention Reports	Francesca Bonin, Ailbhe Finnerty, Candice Moore, Charles Jochim, Emma Norris, Yufang Hou, Martin Gleize, Debasis Ganguly, Alison J. Wright, Emily Hayes, Silje Zink, Alessandra Pascale, Pol Mac Aonghusa and Susan Michie
344	A French Corpus and Annotation Schema for Named Entity Recognition and Relation Extraction of Financial News	Ali Jabbari, Olivier Sauvage, Hamada Zeine and Hamza Chergui
345	AR-ASAG An ARabic Dataset for Automatic Short Answer Grading Evaluation	Leila OUAHRANI and Djamal BENNOUAR
346	World Class Language Technology - Developing a Language Technology Strategy for Danish	Sabine Kirchmeier, Bolette Pedersen, Sanni Nimb, Philip Diderichsen and Peter Juel Henrichsen
347	SpiCE: A New Open-Access Corpus of Conversational Bilingual Speech in Cantonese and English	Khia Johnson, Molly Babel, Ivan Fong and Nancy Yiu
348	Cross-lingual Structure Transfer for Zero-resource Event Extraction	Di Lu, Ananya Subburathinam, Heng Ji, Jonathan May, Shih-Fu Chang, Avi Sil and Clare Voss
350	Diversity, Density, and Homogeneity: Quantitative Characteristic Metrics for Text Collections	Yi-An Lai, Xuan Zhu, Yi Zhang and Mona Diab
351	Towards Few-Shot Event Mention Retrieval: An Evaluation Framework and A Siamese Network Approach	Bonan Min, Yee Seng Chan and Lingjun Zhao
353	SC-CoMIcs: A Superconductivity Corpus for Materials Informatics	Kyosuke Yamaguchi, Ryoji Asahi and Yutaka Sasaki
354	Coursera Corpus Mining and Multistage Fine-Tuning for Improving Lectures Translation	Haiyue Song, Raj Dabre, Atsushi Fujita and Sadao Kurohashi
355	Being Generous with Sub-Words towards Small NMT Children	Arne Defauw, Tom Vanallemeersch, Koen Van Winckel, Sara Szoc and Joachim Van den Bogaert
356	The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems	Alberto Chierici, Nizar Habash and Margarita Bicec
357	Toward Qualitative Evaluation of Embeddings for Arabic Sentiment Analysis	Amira Barhoumi, Nathalie Camelin, Chafik Aloulou, Yannick Estève and Lamia Hadrich Belguith
360	User Acceptance of Proactive Voice Assistant Behavior	Maria Schmidt, Wolfgang Minker and Steffen Werner
361	RKorAPClient: An R Package for Accessing the German Reference Corpus DeReKo via KorAP	Marc Kupietz, Nils Diewald and Eliza Margaretha
362	Using deep neural networks with intra- and inter-sentence context to classify suicidal behaviour	Xingyi Song, Johnny Downs, Sumithra Velupillai, Rachel Holden, Maxim Kikoler, Kalina Bontcheva, Rina Dutta and Angus Roberts
364	On the Influence of Coreference Resolution on Word Embeddings in Lexical-semantic Evaluation Tasks	Alexander Henlein and Alexander Mehler
365	Annotation of Emotion Carriers in Personal Narratives	Aniruddha Tammewar, Alessandra Cervone, Eva-Maria Messner and Giuseppe Riccardi
366	Opening the Romance Verbal Inflection Dataset 2.0: A CLDF lexicon	Sacha Beniamine, Martin Maiden and Erich Round
367	Identifying Cognates in English-Dutch and French-Dutch by means of Orthographic Information and Cross-lingual Word Embeddings	Els Lefever, Sofie Labat and Pranaydeep Singh
368	Cross-Domain Evaluation of Edge Detection for Biomedical Event Extraction	Alan Ramponi, Barbara Plank and Rosario Lombardo
369	The rJokes Dataset: a Large Scale Humor Collection	Orion Weller and Kevin Seppi
370	Linguistic, Kinematic and Gaze Information in Task Descriptions: The LKG-Corpus	Tim Reinboth, Stephanie Gross, Laura Bishop and Brigitte Krenn
371	wikiHowToImprove: A Resource and Analyses on Edits in Instructional Texts	Talita Anthonio, Irshad Bhat and Michael Roth
372	Developing a Corpus of Indirect Speech Act Schemas	Antonio Roque, Alexander Tsuetaki, Vasanth Sarathy and Matthias Scheutz
373	Towards Interactive Annotation for Hesitation in Conversational Speech	Jane Wottawa, Marie Tahon, Apolline Marin and Nicolas Audibert
376	Emotional Speech Corpus for Persuasive Dialogue System	Sara Asai, Koichiro Yoshino, Seitaro Shinagawa, Sakriani Sakti and Satoshi Nakamura
377	The Potsdam Commentary Corpus 2.2: Extending Annotations for Shallow Discourse Parsing	Peter Bourgonje and Manfred Stede
378	Is Language Modeling Enough? Evaluating Effective Embedding Combinations	Rudolf Schneider, Tom Oberhauser, Paul Grundmann, Felix Alexander Gers, Alexander Loeser and Steffen Staab
379	Annotating Perspectives on Vaccination	Roser Morante, Chantal van Son, Isa Maks and Piek Vossen
380	Must Children be Vaccinated or not? Annotating Modal Verbs in the Vaccination Debate	Liza King and Roser Morante
381	Wiki-40B: Multilingual Language Model Dataset	Mandy Guo, Zihang Dai, Denny Vrandečić and Rami Al-Rfou
382	SQuAD2-CR: Semi-supervised Annotation for Cause and Rationales for Unanswerability in SQuAD 2.0	Gyeongbok Lee, Seung-won Hwang and Hyunsouk Cho
383	word2word: A Collection of Bilingual Lexicons for 3,564 Language Pairs	Yo Joong Choe, Kyubyong Park and Dongwoo Kim
384	Processing Language Resources of Under-Resourced and Endangered Languages for the Generation of Augmentative Alternative Communication Boards	Anne Ferger
385	A Corpus for Automatic Readability Assessment and Text Simplification of German	Alessia Battisti, Dominik Pfütze, Andreas Säuberli, Marek Kostrzewa and Sarah Ebling
386	Large Corpus of Czech Parliament Plenary Hearings	Jonas Kratochvil, Peter Polak and Ondrej Bojar
387	Aligning Wikipedia with WordNet:a review and evaluation of different techniques	Antoni Oliver
388	Language Agnostic Automatic Summarization Evaluation	Christopher Tauchmann and Margot Mieskes
391	Lexicogrammatic translationese across two targets and competence levels	Maria Kunilovskaya and Ekaterina Lapshinova-Koltunski
392	Linguistic Appropriateness and Pedagogic Usefulness of Reading Comprehension Questions	Andrea Horbach, Itziar Aldabe, Marie Bexte, Oier Lopez de Lacalle and Montse Maritxalar
393	Jamo Pair Encoding: Subcharacter Representation-based Extreme Korean Vocabulary Compression for Effecient Subword Tokenization	Sangwhan Moon and Naoaki Okazaki
394	On the Creation of a Corpus for Coherence Evaluation of Discursive Units	Elham Mohammadi, Timothe Beiko and Leila Kosseim
395	The Nisvai Corpus of Oral Narrative Practices from Malekula (Vanuatu) and its Associated Language Resources	Jocelyn Aznar and Núria Gala
397	Sensitive Data Detection and Classification in Spanish Clinical Text: Experiments with BERT	Aitor García Pablos, Naiara Perez and Montse Cuadros
398	Joint Learning of Syntactic Features helps Discourse Segmentation	Takshak Desai, Parag Pravin Dakle and Dan Moldovan
400	Introducing Lexical Masks: a New Representation of Lexical Entries for Better Evaluation and Exchange of Lexicons	Bruno Cartoni, Daniel Calvelo Aros, Denny Vrandecic and Saran Lertpradit
401	Dataset Reproducibility and IR Methods in Timeline Summarization	Leo Born, Maximilian Bacher and Katja Markert
402	Multimodal Analysis of Cohesion in Multi-party Interactions	Reshmashree Bangalore Kantharaju, Caroline Langlet, Mukesh Barange, Chloé Clavel and Catherine Pelachaud
403	Building a Time-Aligned Cross-Linguistic Reference Corpus from Language Documentation Data (DoReCo)	Ludger Paschen, François Delafontaine, Christoph Draxler, Susanne Fuchs, Matthew Stave and Frank Seifart
404	Document Sub-structure in Neural Machine Translation	Radina Dobreva, Jie Zhou and Rachel Bawden
405	The CLARIN Knowledge Centre for Atypical Communication Expertise	Henk van den Heuvel, Nelleke Oostdijk, Caroline Rowland and Paul Trilsbeek
406	Benchmarking Neural and Statistical Machine Translation on Low-Resource African Languages	Kevin Duh, Paul McNamee, Matt Post and Brian Thompson
407	Glawinette: a linguistically motivated derivational description of French acquired from GLAWI	Nabil Hathout, Franck Sajous, Basilio Calderone and Fiammetta Namer
409	Improved Finite-State Morphological Analysis for St. Lawrence Island Yupik Using Paradigm Function Morphology	Emily Chen, Hyunji (Hayley) Park and Lane Schwartz
411	CAMeL Tools: An Open Source Python Toolkit for Arabic Natural Language Processing	Ossama Obeid, Nasser Zalmout, Salam Khalifa, Dima Taji, Mai Oudah, Bashar Alhafni, Go Inoue, Fadhl Al Eryani, Alexander Erdmann and Nizar Habash
412	Using Multilingual Resources to Evaluate CEFRLex for Learner Applications	Johannes Graën, David Alfter and Gerold Schneider
414	ReSiPC: a tool for complex searches in parallel corpora	Antoni Oliver and Bojana Mikelenić
415	Video Caption Dataset for Describing Human Actions in Japanese	Yutaro Shigeto, Yuya Yoshikawa, Jiaqing Lin and Akikazu Takeuchi
416	Treating Dialogue Quality Evaluation as an Anomaly Detection Problem	Rostislav Nedelchev, Ricardo Usbeck and Jens Lehmann
417	GRAIN-S: manually annotated syntax for German interviews	Agnieszka Falenska, Zoltán Czesznak, Kerstin Jung, Moritz Völkel, Wolfgang Seeker and Jonas Kuhn
419	Abusive language in Spanish teenager’s conversations: data preparation and short text classification with contextual word embeddings	Marta R. Costa-jussà, Esther González and Asuncion Moreno
420	A Large-Scale Leveled Readability Lexicon for Standard Arabic	Muhamed Al Khalil, Nizar Habash and Zhengyang Jiang
422	Image Position Prediction in Multimodal Documents	Masayasu Muraoka, Ryosuke Kohita and Etsuko Ishii
423	SweDiL: An Annotated Corpus of Dialogues in Swedish Literary Fiction	Sara Stymne and Carin Östman
424	Evaluation of Argument Search Approaches in the Context of Argumentative Dialogue Systems	Niklas Rach, Yuki Matsuda, Johannes Daxenberger, Stefan Ultes, Keiichi Yaumoto and Wolfgang Minker
425	PATE: A Corpus of Temporal Expressions for the In-car Voice Assistant Domain	Alessandra Zarcone, Touhidul Alam and Zahra Kolagar
426	Semantic Annotation for Improved Safety in Construction Work	Paul Thompson, Tim Yates, Emrah Inan and Sophia Ananiadou
427	IIIT-H TEMD Semi-Natural Emotional Speech Database from Professional Actors and Non-Actors	Banothu Rambabu, Kishore Kumar Botsa, Gangamohan Paidi and Suryakanth V Gangashetty
428	Language Modeling with a General Second-Order RNN	Diego Maupomé and Marie-Jean Meurs
429	Augmented Prompt Selection for Evaluation of Spontaneous Speech Synthesis	Eva Szekely, Jens Edlund and Joakim Gustafson
430	Social Web Observatory: A Platform and Method for Gathering Knowledge on Entities from Different Textual Sources	Leonidas Tsekouras, Georgios Petasis, George Giannakopoulos and Aris Kosmopoulos
431	Preserving Semantic Information from Old Dictionaries: Linking Senses of the 'Altfranzösisches Wörterbuch' to WordNet	Achim Stein
433	EmpiriST Corpus 2.0: Adding Manual Normalization, Lemmatization and Semantic Tagging to a German Web and CMC Corpus	Thomas Proisl, Natalie Dykes, Philipp Heinrich, Besim Kabashi, Andreas Blombach and Stefan Evert
434	Development of a Corpus Annotated with Medications and their Attributes in Psychiatric Health Records	Jaya Chaturvedi, Natalia Viani, Jyoti Sanyal, Chloe Tytherleigh, Idil Hasan, Kate Baird, Sumithra Velupillai, Robert Stewart and Angus Roberts
435	The POTUS Corpus, a database of weekly addresses for the study of stance in politics and virtual agents	Thomas Janssoone, Kévin Bailly, Gaël Richard and Chloé Clavel
436	Database Search vs. Information Retrieval: A Novel Method for Studying Natural Language Querying of Semi-Structured Data	Stefanie Nadig, Martin Braschler and Kurt Stockinger
437	A First Dataset for Film Age Appropriateness Investigation	Emad Mohamed and Le An Ha
438	UniSent: Universal Adaptable Sentiment Lexica for 1000+ Languages	Ehsaneddin Asgari, Fabienne Braune, Benjamin Roth, Christoph Ringlstetter and Mohammad Mofrad
439	ATC-ANNO: Semantic Annotation for Air Traffic Control with Assistive Auto-Annotation	Marc Schulder, Johannah O'Mahony, Yury Bakanouski and Dietrich Klakow
440	Towards a Gold Standard for Evaluating Danish Word Embeddings	Nina Schneidermann, Rasmus Hvingelby and Bolette Pedersen
441	Towards a Spell Checker for Zamboanga Chavacano Orthography	Marcelo Yuji Himoro and Antonio Pareja-Lora
442	NegBERT: A Transfer Learning Approach for Negation Detection and Scope Resolution	Aditya Khandelwal and Suraj Sawant
443	Urban Dictionary Embeddings for Slang NLP Applications	Steven Wilson, Walid Magdy, Barbara McGillivray, Kiran Garimella and Gareth Tyson
444	Spatial Multi-Arrangement for Clustering and Multi-way Similarity Dataset Construction	Olga Majewska, Diana McCarthy, Jasper van den Bosch, Nikolaus Kriegeskorte, Ivan Vulić and Anna Korhonen
446	Fakeddit: A New Multimodal Benchmark Dataset for Fine-grained Fake News Detection	Kai Nakamura, Sharon Levy and William Yang Wang
448	A Short Survey on Sense-Annotated Corpora	Tommaso Pasini and Jose Camacho-Collados
449	HamNoSyS2SiGML: Translating HamNoSys Into SiGML	Carolina Neves, Luísa Coheur and Hugo Nicolau
450	Habibi - a multi Dialect multi National Arabic Song Lyrics Corpus	Mahmoud El-Haj
451	GoodNewsEveryone: A Corpus of News Headlines Annotated with Emotions, Semantic Roles, and Reader Perception	Laura Ana Maria Bostan, Evgeny Kim and Roman Klinger
452	MASRI-HEADSET: A Maltese Corpus for Speech Recognition	Carlos Daniel Hernandez Mena, Albert Gatt, Andrea DeMarco, Claudia Borg, Lonneke van der Plas, Amanda Muscat and Ian Padovani
453	Corpora of Disordered Speech in the Light of the GDPR: Two Use Cases from the DELAD Initiative	Henk van den Heuvel, Aleksei Kelli, KATARZYNA KLESSA and Satu Salaasti
455	Identifying Sentiments in Algerian Code-switched User-generated Comments	Wafia Adouane, Samia Touileb and Jean-Philippe Bernardy
457	Using Distributional Thesaurus Embedding for Co-hyponymy Detection	Abhik Jana, Nikhil Varimala and Pawan Goyal
458	Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	Angrosh Mandya, James O' Neill, Danushka Bollegala and Frans Coenen
463	BabyFST - Towards a Finite-State Based Computational Model of Ancient Babylonian	Aleksi Sahala, Miikka Silfverberg, Antti Arppe and Krister Lindén
464	GitHub Typo Corpus: A Large-Scale Multilingual Dataset of Misspellings and Grammatical Errors	Masato Hagiwara and Masato Mita
466	Aspect On: an Interactive Solution for Post-Editing the Aspect Extraction based on Online Learning	Mara Chinea-Rios, Marc Franco-Salvador and Yassine Benajiba
468	Offensive Language and Hate Speech Detection for Danish	Gudbjartur Ingi Sigurbergsson and Leon Derczynski
469	An Evaluation Benchmark for Testing the Word Sense Disambiguation Capabilities of Machine Translation Systems	Alessandro Raganato, Yves Scherrer and Jörg Tiedemann
472	Visual Grounding Annotation of Recipe Flow Graph	Taichi Nishimura, Suzushi Tomori, Hayato Hashimoto, Atsushi Hashimoto, Yoko Yamakata, Jun Harashima, Yoshitaka Ushiku and Shinsuke Mori
475	NUBes: A Corpus of Negation and Uncertainty in Spanish Clinical Texts	Salvador Lima Lopez, Naiara Perez, Montse Cuadros and German Rigau
476	HitzalMed: Anonymisation of Clinical Text in Spanish	Salvador Lima Lopez, Naiara Perez, Laura García-Sardiña and Montse Cuadros
478	Annotation of Adverse Drug Reactions in Patients' Weblogs	Yuki Arase, Tomoyuki Kajiwara and Chenhui Chu
479	Mapping the Dialog Act Annotations of the LEGO Corpus into ISO 24617-2 Communicative Functions	Eugénio Ribeiro, Ricardo Ribeiro and David Martins de Matos
482	Estimating User Communication Styles for Spoken Dialogue Systems	Juliana Miehle, Isabel Feustel, Julia Hornauer, Wolfgang Minker and Stefan Ultes
484	Immersive Language Exploration with Object Recognition and Augmented Reality	Benny Platte, Anett Platte, Christian Roschke, Rico Thomanek, Thony Rolletschke, Frank Zimmer and Marc Ritter
486	RiQuA: A Corpus of Rich Quotation Annotation for English Literary Text	Sean Papay and Sebastian Padó
489	Named Entities in Medical Case Reports: Corpus and Experiments	Sarah Schulz, Jurica Ševa, Samuel Rodriguez, Malte Ostendorff and Georg Rehm
490	Morphological Disambiguation for Gulf Arabic: The Interplay between Resources and Methods	Salam Khalifa, Nasser Zalmout and Nizar Habash
491	Know thy corpus! Robust methods for the digital curation of Web corpora	Serge Sharoff
492	All That Glitters is Not Gold: A Gold Standard of Adjective-Noun Collocations for German	Yana Strakatova, Neele Falk, Isabel Fuhrmann, Erhard Hinrichs and Daniela Rossmann
493	Creating a Corpus of Gestures and Predicting the Audience Response based on Gestures in Speeches of Donald Trump	Verena Ruf and Costanza Navarretta
494	CLEEK: A Chinese Long-text Corpus for Entity Linking	Weixin Zeng, Xiang Zhao, Jiuyang Tang, Zhen Tan and Xuqian Huang
495	Wikinflection Corpus: A (Better) Multilingual, Morpheme-Annotated Inflectional Corpus	Eleni Metheniti and Guenter Neumann
496	Hedwig: A Named Entity Linker	Marcus Klang and Pierre Nugues
498	Variants of Vector Space Reductions for Predicting the Compositionality of English Noun Compounds	Pegah Alipoor and Sabine Schulte im Walde
502	MEDLINE as a parallel corpus: a survey to gain insight on French-, Spanish- and Portuguese-speaking authors’ abstract writing practice	Aurélie Névéol, Antonio Jimeno Yepes and Mariana Neves
503	Building a Multimodal Entity Linking Dataset From Tweets	Omar ADJALI, Romaric Besançon, Olivier Ferret, Hervé Le Borgne and Brigitte Grau
504	Two Huge Title and Keyword Generation Corpora of Research Articles	Erion Çano and Ondřej Bojar
505	A Multi-level Annotated Corpus of Scientific Papers for Scientific Document Summarization and Cross-document Relation Discovery	Ahmed AbuRa'ed, Horacio Saggion and Luis Chiruzzo
506	The ISO Standard for Dialogue Act Annotation, Second Edition	Harry Bunt, Volha Petukhova, Emer Gilmartin, Catherine Pelachaud, Alex Fang, Simon Keizer and Laurent Prévot
508	Cifu: a frequency lexicon of Hong Kong Cantonese	Regine Lai and Grégoire Winterstein
510	SOLO: A Corpus of Tweets for Examining the State of Being Alone	Svetlana Kiritchenko, Will Hipson, Robert Coplan and Saif Mohammad
511	The Medical Scribe: Corpus Development and Model Performance Analyses	Izhak Shafran, Nan Du, Linh Tran, Amanda Perry, Lauren Keyes, Mark Knichel, Ashley Domin, Lei Huang, Yu-hui Chen, Gang Li, Mingqiu Wang, Laurent El Shafey, Hagen Soltau and Justin Stuart Paul
514	Quality Estimation for Partially Subjective Classification Tasks via Crowdsourcing	Yoshinao Sato and Kouki Miyazawa
515	Automatic Creation of Text Corpora for Low-Resource Languages from the Internet: The Case of Swiss German	Lucy Linder, Michael Jungo, Jean Hennebert, Andreas Fischer and Claudiu Cristian Musat
519	Decomposing and Comparing Meaning Relations: Paraphrasing, Textual Entailment, Contradiction, and Specificity	Venelin Kovatchev, Darina Gold, M. Antonia Marti, Maria Salamo and Torsten Zesch
520	JASS: Japanese-specific Sequence to Sequence Pre-training for Neural Machine Translation	Zhuoyuan Mao, Fabien Cromieres, Raj Dabre, Haiyue Song and Sadao Kurohashi
521	Decode with Template: Content Preserving Sentiment Transfer	Zhiyuan Wen, Jiannong Cao, Ruosong Yang and Senzhang Wang
522	The xtsv Framework and the Twelve Virtues of Pipelines	Balázs Indig, Bálint Sass and Iván Mittelholcz
523	The AICO Corpus	Kristiina Jokinen
524	A Corpus Linguistic Perspective on Contemporary German Pop Lyrics with the Multi-Layer Annotated "Songkorpus"	Roman Schneider
525	Evaluating Sub-word embeddings in cross-lingual models	ali hakimi parizi and Paul Cook
527	A Post-Editing Dataset in the Legal Domain: Do we Underestimate Neural Machine Translation Quality?	Julia Ive, Lucia Specia, Sara Szoc, Tom Vanallemeersch, Joachim Van den Bogaert, Eduardo Farah, Christine Maroti, Artur Ventura and Maxim Khalilov
528	GeCzLex: Lexicon of Czech and German Anaphoric Connectives	Lucie Poláková, Kateřina Rysová, Magdaléna Rysová and Jiří Mírovský
532	The BDCamões Collection of Portuguese Literary Documents: a Research Resource for Digital Humanities and Language Technology	Sara Grilo, Márcia Bolrinha, João Silva, Rui Vaz and António Branco
533	Odi et Amo. Creating, Evaluating and Extending Sentiment Lexicons for Latin.	Rachele Sprugnoli, Marco Passarotti, Daniela Corbetta and Andrea Peverelli
539	Object Naming in Language and Vision: A Survey and a New Dataset	Carina Silberer, Sina Zarrieß and Gemma Boleda
540	A Corpus of Controlled Opinionated and Knowledgeable Movie Discussions for Training Neural Conversation Models	Fabian Galetzka, Chuwkuemeka Uchenna Eneh and David Schlangen
542	A Swiss German Dictionary: Variation in Speech and Writing	Larissa Schmidt, Lucy Linder, Sandra Djambazovska, Alexandros Lazaridis, Tanja Samardžić and Claudiu Musat
543	The MWN.PT WordNet for Portuguese: Projection, Validation, Cross-lingual Alignment and Distribution	António Branco, Sara Grilo, Márcia Bolrinha, Chakaveh Saedi, Ruben Branco, João Silva, Andreia Querido, Rita de Carvalho, Rosa Gaudio, Mariana Avelãs and Clara Pinto
544	A French Medical Conversations Corpus Annotated for a Virtual Patient Dialogue System	Fréjus A. A. Laleye, Gaël de Chalendar, Antonia Blanié, Antoine Brouquet and Dan Behnamou
546	A Web-based Collaborative Annotation and Consolidation Tool	Tobias Daudert
548	Predicting the MPAA Rating Based on Movie Dialogues	mahsa shafaei, Niloofar Safi Samghabadi, Sudipta Kar and Thamar Solorio
550	Recommendation Chart of Domains for Cross-Domain Sentiment Analysis: Findings of A 20 Domain Study	Akash Sheoran, Diptesh Kanojia, Aditya Joshi and Pushpak Bhattacharyya
551	WordWars: A Dataset to Examine the Natural Selection of Words	Saif Mohammad
553	Varying Vector Representations and Integrating Meaning Shifts into a PageRank Model for Automatic Term Extraction	Anurag Nigam, Anna Hätty and Sabine Schulte im Walde
557	Optimising Twitter-based Political Election Prediction with Relevance andSentiment Filters	Eric Sanders and Antal van den Bosch
562	Crowdsourcing in the Development of a Multilingual FrameNet: A Case Study of Korean FrameNet	Younggyun Hahm, Youngbin Noh, Ji Yoon Han, Tae Hwan Oh, Hyonsu Choe, Hansaem Kim and KEY-SUN CHOI
563	Getting To Know You: User Attribute Extraction from Dialogues	Chien-Sheng Wu, Andrea Madotto, Zhaojiang Lin, Peng Xu and Pascale Fung
565	Email Classification Incorporating Social Networks and Thread Structure	Sakhar Alkhereyf and Owen Rambow
567	MSD-1030: A Well-built Multi-Sense Evaluation Dataset for Sense Representation Models	Ting-Yu Yen, Yang-Yin Lee, Yow-Ting Shiue, Hen-Hsen Huang and Hsin-Hsi Chen
568	A Contract Corpus for Recognizing Rights and Obligations	Ruka Funaki, Yusuke Nagata, Kohei Suenaga and Shinsuke Mori
569	Recognition of Implicit Geographic Movement in Text	Scott Pezanowski and Prasenjit Mitra
570	Extraction of the Argument Structure of Tokyo Metoropolitan Assembly Minutes: Segmentation of Question-and-Answer Sets	Keiichi Takamaru, Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Kotaro Sakamoto, Madoka Ishioroshi, Teruko Mitamura and Noriko Kando
572	A Real-Time System for Credibility on Twitter	Adrian Iftene and Daniela Gifu
574	Beyond Citation: Corpus-based Methods for Assessing the Impact of Research Outcomes on Society	Rezvaneh Rezapour, Jana Diesner, Jutta Bopp, Norman Fiedler, Diana Steffen and Andreas Witt
575	DiMLex-Bangla: A Lexicon of Bangla Discourse Connectives	Debopam Das, Manfred Stede, Ghosh Soumya and Lahari Chatterjee
576	Yorùbá Dependency Treebank (YTB)	Ọlájídé Ishola and Daniel Zeman
578	Best Student Forcing: A Simple Training Mechanism in Adversarial Language Generation	Jonathan Sauder, Ting Hu, Xiaoyin Che, Goncalo Mordido, Haojin Yang and Christoph Meinel
580	The European Language Technology Landscape in 2020: Language-Centric and Human-Centric AI for Cross-Cultural Communication in Multilingual Europe	Georg Rehm, Katrin Marheinecke, Stefanie Hegele, Stelios Piperidis, Kalina Bontcheva, Jan Hajic, Khalid Choukri, Andrejs Vasiļjevs, Gerhard Backfried, Christoph Prinz, Jose Manuel Gomez Perez, Luc Meertens, Paul Lukowicz, Josef van Genabith, Andrea Lösch, Philipp Slusallek, Morten Irgens, Patrick Gatellier, Joachim Köhler, Laure Le Bars, Albina Auksoriūtė, Núria Bel, António Branco, Gerhard Budin, Walter Daelemans, Koenraad De Smedt, Radovan Garabík, Maria Gavriilidou, Dagmar Gromann, Svetla Koeva, Simon Krek, Cvetana Krstev, Krister Lindén, Bernardo Magnini, Jan Odijk, Maciej Ogrodniczuk, Eric Ras, Eiríkur Rögnvaldsson, Mike Rosner, Bolette Pedersen, Inguna Skadina, Marko Tadić, Dan Tufiș, Tamás Váradi, Kadri Vider, Andy Way and François Yvon
582	English Recipe Flow Graph Corpus	Yoko Yamakata, Shinsuke Mori and John Carroll
584	Dataset for Temporal Analysis of English-French Cognates	Esteban Frossard, Mickael Coustaty, Antoine Doucet, Adam Jatowt and Simon Hengchen
585	Linguistically Informed Hindi-English Neural Machine Translation	Vikrant Goyal, Pruthwik Mishra and Dipti Misra Sharma
586	Towards a Corsican Basic Language Resource Kit	Laurent Kevers and Stella Retali-Medori
587	Representation Learning for Unseen Words by Bridging Subwords to Semantic Networks	Yeachan Kim, Kang-Min Kim and SangKeun Lee
588	Development of a General-Purpose Categorial Grammar Treebank	Yusuke Kubota, Koji Mineshima, Noritsugu Hayashi and Shinya Okano
589	A Test Set for Discourse Translation from Japanese to English	Masaaki Nagata and Makoto Morishita
592	Inference Annotation of a Chinese Corpus for Opinion Mining	Liyun Yan, Danni E, Mei Gan, Cyril Grouin and Mathieu Valette
593	An Experiment in Annotating Animal Species Names from ISTEX Resources	Sabine Barreaux and Dominique Besagni
594	Dependency Parsing for Urdu: Resources, Conversions and Learning	Toqeer Ehsan and Miriam Butt
596	Evaluating the Impact of Sub-word Information and Cross-lingual Word Embeddings on Mi'kmaq Language Modelling	Jeremie Boudreau, Akankshya Patra, Ashima Suvarna and Paul Cook
598	Prague Dependency Treebank - Consolidated 1.0	Jan Hajic, Eduard Bejček, Jaroslava Hlavacova, Marie Mikulová, Milan Straka, Jan Štěpánek and Barbora Štěpánková
600	Generating Responses that Reflect Meta Information in User-Generated Question Answer Pairs	Takashi Kodama, Ryuichiro Higashinaka, Koh Mitsuda, Ryo Masumura, Yushi Aono, Ryuta Nakamura, Noritake Adachi and Hidetoshi Kawabata
602	Give your Text Representation Models some Love: the Case for Basque	Rodrigo Agerri, Iñaki San Vicente, Jon Ander Campos, Ander Barrena, Xabier Saralegi, Aitor Soroa and Eneko Agirre
604	Introducing a Large-Scale Dataset for Vietnamese POS Tagging on Conversational Texts	Oanh Tran, Tu Pham and Vu Dang
606	Augmenting Small Data to classify Contextualized Dialogue Acts \\ for Exploratory Visualization	Abhinav Kumar, Barbara Di Eugenio, Jillian Aurisano and Andrew Johnson
607	The ACQDIV Corpus Database and Aggregation Pipeline	Anna Jancso, Steven Moran and Sabine Stoll
608	Cooking Up a Neural-based Model for Recipe Classification	Elham Mohammadi, Nada Naji, Louis Marceau, Eric Charton, Leila Kosseim and Marie-Jean Meurs
609	Automatic Period Segmentation of Oral French	Natalia Kalashnikova, Loïc Grobol, Iris Eshkol-Taravella and François Delafontaine
610	Why Attention is Not Explanation: Surgical Intervention and Causal Reasoning about Neural Models	Christopher Grimsley, Elijah Mayfield and Julia R.S. Bursten
611	Semi-supervised Deep Embedded Clustering with Anomaly Detection for Semantic Frame Induction	Zheng Xin Yong and Tiago Torrent
613	CanVEC - the Canberra Vietnamese-English Code-switching Natural Speech Corpus	Li Nguyen and Christopher Bryant
614	Enhancing a Lexicon of Polarity Shifters through the Supervised Classification of Shifting Directions	Marc Schulder, Michael Wiegand and Josef Ruppenhofer
616	A Spelling Correction Corpus for Multiple Arabic Dialects	Fadhl Al Eryani, Nizar Habash, Houda Bouamor and Salam Khalifa
617	A Framework for Shared Agreement of Language Tags beyond ISO 639	Frances Gillis-Webber and Sabine Tittel
620	On the Correlation of Word Embedding Evaluation Metrics	François Torregrossa, Vincent Claveau, Nihel Kooli, Guillaume Gravier and Robin Allesiardo
621	Material Philology Meets Digital Onomastic Lexicography: The NordiCon Database of Medieval Nordic Personal Names in Continental Sources	Michelle Waldispühl, Dana Dannells and Lars Borin
622	Exploring a Choctaw Language Corpus with Word Vectors and Minimum Distance Length	Jacqueline Brixey, David Sides, Timothy Vizthum, David Traum and Khalil Iskarous
623	Evaluating Approaches to Personalizing Language Models	Milton King and Paul Cook
624	AIA-BDE: A Corpus of FAQs in Portuguese and their Variations	Hugo Gonçalo Oliveira, João Ferreira, José Santos, Pedro Fialho, Ricardo Rodrigues, Luisa Coheur and Ana Alves
625	Providing semantic knowledge to a set of pictograms for people with disabilities: a set of links between WordNet and Arasaac: Arasaac-WN	Didier Schwab, Pauline Trial, Céline Vaschalde, Loïc Vial and Benjamin Lecouteux
627	Data Query Language and Corpus Tools for Slot-Filling and Intent Classification Data	Stefan Larson, Eric Guldan and Kevin Leach
628	A Dataset for Multi-lingual Epidemiological Event Extraction	Stephen Mutuvi, Antoine Doucet, Gael Lejeune and Moses Odeo
630	Semi-Supervised Tri-Training for Explicit Discourse Argument Expansion	Rene Knaebel and Manfred Stede
631	Search Query Language Identification Using Weak Labeling	Ritiz Tambi, Ajinkya Kale and Tracy Holloway King
632	Development and Validation of a Corpus for Machine Humor Comprehension	Yuen-Hsien Tseng, Wun-Syuan Wu, Chia-Yueh Chang, Hsueh-Chih Chen and Wei-Lun Hsu
633	Alector: A Parallel Corpus of Simplified French Texts with Alignments of Misreadings by Poor and Dyslexic Readers	Nuria Gala, Anaïs Tack, Ludivine Javourey-Drevet, Thomas François and Johannes C. Ziegler
634	SHR++: An Interface for Morpho-syntactic annotation of Sanskrit Corpora	Amrith Krishna, Shiv Vidhyut, Dilpreet Chawla, Sruti Sambhavi and Pawan Goyal
635	Figure Me Out: A Gold Standard Dataset for Metaphor Interpretation	Omnia Zayed, John Philip McCrae and Paul Buitelaar
637	Extrinsic Evaluation of French Dependency Parsers on a Specialized Corpus: Comparison of Distributional Thesauri	Ludovic Tanguy, Pauline Brunet and Olivier Ferret
640	RDG-Map: A Multimodal Corpus of Pedagogical Human-Wizard Spoken Interactions.	Maike Paetzel, Deepthi Karkada and Ramesh Manuvinakurike
641	MPDD: A Multi-Party Dialogue Dataset for Analysis of Emotions and Interpersonal Relationships	Yi-Ting Chen, Hen-Hsen Huang and Hsin-Hsi Chen
642	“Alexa in the wild” – Collecting unconstrained conversations with a modern voice assistant in a public environment	Ingo Siegert
643	Have a Cake and Eat it Too: Assessing Discriminating Performance of an Intelligibility Index Obtained from a Reduced Sample Size	Anna Marczyk, Alain Ghio, Muriel Lalain, Marie Rebourg, Corinne Fredouille and Virginie Woisard
645	Gigafida 2.0: The Reference Corpus of Written Standard Slovene	Simon Krek, Špela Arhar Holdt, Tomaž Erjavec, Jaka Čibej, Andraz Repar, Polona Gantar, Nikola Ljubešić, Iztok Kosem and Kaja Dobrovoljc
647	A Term Extraction Approach to Survey Analysis in Health Care	Cécile Robin, Mona Isazad Mashinchi, Fatemeh Ahmadi Zeleti, Adegboyega Ojo and Paul Buitelaar
648	A Corpus for Detecting High-Context Clinical Indications in Intensive Care Patient Notes Focusing on Frequently Readmitted Patients	Edward T. Moseley, Joy T. Wu, Jonathan Welt, John Foote, Patrick D. Tyler, David W. Grant, Eric T. Carlson, Sebastian Gehrmann, Franck Dernoncourt and Leo Anthony Celi
649	Challenge Dataset of Cognates and False Friend Pairs from Indian Languages	Diptesh Kanojia, Malhar Kulkarni, Pushpak Bhattacharyya and Gholamreza Haffari
651	Dataset and Enhanced Model for Eligibility Criteria-to-SQL Semantic Parsing	Xiaojing Yu, Tianlong Chen, Zhengjie Yu, Huiyu Li, Yang Yang, Xiaoqian Jiang and Anxiao Jiang
652	Enriching Existing Conversational Emotion Datasets with Dialogue Acts using Neural Annotators	Chandrakant Bothe, Cornelius Weber, Sven Magg and Stefan Wermter
653	A Corpus of Turkish Offensive Language on Social Media	Çağrı Çöltekin
655	Dicta-Sign-LSF-v2: Remake of a Continuous French Sign Language Dialogue Corpus and a First Baseline for Automatic Sign Language Processing	Valentin Belissen, Annelies Braffort and Michèle Gouiffès
659	Multilingual Stance Detection in Tweets: The Catalonia Independence Corpus	Elena Zotova, Rodrigo Agerri, Manuel Nuñez and German Rigau
661	CBOW-tag: a Modified CBOW Algorithm for Generating Embedding Models from Annotated Corpora	Attila Novák, László Laki and Borbála Novák
664	A Scientific Information Extraction Dataset for Nature Inspired Engineering	Ruben Kruiper, Julian F.V. Vincent, Jessica Chen-Burger, Marc P.Y. Desmulliez and Ioannis Konstas
665	Evaluation Metrics for Headline Generation Using Deep Pre-Trained Embeddings	Abdul Moeed, Yang An, Gerhard Hagerer and Georg Groh
667	Corpus Generation for voice command in smart home and the effect of speech synthesis on End-to-End SLU	Thierry Desot, François Portet and Michel Vacher
668	An Evaluation of Progressive Neural Networksfor Transfer Learning in Natural Language Processing	Abdul Moeed, Gerhard Hagerer, Sumit Dugar, Sarthak Gupta and Georg Groh
669	An Annotated Corpus for Noun Ellipsis in English	Payal Khullar, Kushal Majmundar and Manish Shrivastava
670	SibLing Corpus of Russian Dialogue Speech Designed for Research on Speech Entrainment	Tatiana Kachkovskaia, Tatiana Chukaeva, Vera Evdokimova, Pavel Kholiavin, Natalia Kriakina, Daniil Kocharov, Anna Mamushina, Alla Menshikova and Svetlana Zimina
673	Massive vs. Curated Word Embeddings for Low-Resourced Languages. The Case of Yorùbá and Twi	Jesujoba Alabi, Kwabena Amponsah-Kaakyire, David Adelani and Cristina España-Bonet
674	TutorialVQA: Question Answering Dataset for Tutorial Videos	Anthony Colas, Seokhwan Kim, Franck Dernoncourt, Siddhesh Gupte, Zhe Wang and Doo Soon Kim
675	Controllable Sentence Simplification	Louis Martin, Éric de la Clergerie, Benoît Sagot and Antoine Bordes
676	Recognizing Semantic Relations: Transformers vs. Recurrent Path Models	Dmitri Roussinov, Serge Sharoff and Nadezhda Puchnina
679	Where are we in Named Entity Recognition from Speech?	Antoine Caubrière, Sophie Rosset, Yannick Estève, Antoine LAURENT and Emmanuel Morin
680	Automated Discovery of Mathematical Definitions in Text	Natalia Vanetik, Marina Litvak, Sergey Shevchuk and Lior Reznik
681	Word Attribute Prediction Enhanced by Lexical Entailment Tasks	Mika Hasegawa, Tetsunori Kobayashi and Yoshihiko Hayashi
682	PhonBank and Data Sharing: Recent Developments in European Portuguese	Ana Margarida Ramalho, Maria João Freitas and Yvan Rose
683	A Multimodal Educational Corpus of Oral Courses: Annotation, Analysis and Case Study	salima mdhaffar, Yannick Estève, Antoine LAURENT, Nicolas Hernandez, Richard Dufour, Delphine Charlet, Geraldine Damnati, Solen Quiniou and Nathalie Camelin
684	WorldTree V2: A Corpus of Science-Domain Structured Explanations and Inference Patterns supporting Multi-Hop Inference	Zhengnan Xie, Sebastian Thiem, Jaycie Martin, Elizabeth Wainwright, Steven Marmorstein and Peter Jansen
685	From Spatial Relations to Spatial Configurations	Soham Dan, Parisa Kordjamshidi, Julia Bonn, Archna Bhatia, Zheng Cai, Martha Palmer and Dan Roth
686	An Annotated Dataset of Coreference in English Literature	David Bamman, Olivia Lewke and Anya Mansoor
689	Ontology-Style Relation Annotation: A Case Study	Savong Bou, Naoki Suzuki, Makoto Miwa and Yutaka Sasaki
690	Inferences as a Support towards Less Supervised Construction of Lexical Semantic Resources	Nadia Bebeshina-Clairet and Mathieu Lafourcade
694	AlloVera: A Multilingual Allophone Database	David R. Mortensen, Xinjian Li, Patrick Littell, Alexis MICHAUD, Shruti Rijhwani, Antonios Anastasopoulos, Alan W Black, Florian Metze and Graham Neubig
695	Development of a Japanese Personality Dictionary based on Psychological Methods	Ritsuko Iwai, Daisuke Kawahara, Takatsune Kumada and Sadao Kurohashi
697	Tagging Location Phrases in Text	Paul McNamee, James Mayfield, Cash Costello, Caitlyn Bishop and Shelby Anderson
700	Annotating Event Appearance for Japanese Chess Commentary Corpus	Hirotaka Kameko and Shinsuke Mori
701	Automated Phonological Transcription of Akkadian Cuneiform Text	Aleksi Sahala, Miikka Silfverberg, Antti Arppe and Krister Lindén
703	WikiPossessions: Possession timeline generation as an evaluation benchmark for machine reading comprehension of long texts	Dhivya Chinnappa, Alexis Palmer and Eduardo Blanco
704	Acquiring Social Knowledge about Personality and Driving-related Behavior	Ritsuko Iwai, Daisuke Kawahara, Takatsune Kumada and Sadao Kurohashi
705	UniMorph 3.0: Universal Morphology	Arya D. McCarthy, Christo Kirov, Matteo Grella, Amrit Nidhi, Patrick Xia, Kyle Gorman, Ekaterina Vylomova, Sebastian J. Mielke, Garrett Nicolai, Miikka Silfverberg, Timofey Arkhangelskiy, Nataly Krizhanovsky, Andrew Krizhanovsky, Elena Klyachko, Alexey Sorokin, John Mansfield, Valts Ernštreits, Yuval Pinter, Cassandra L. Jacobs, Ryan Cotterell, Mans Hulden and David Yarowsky
706	Dataset Creation and Evaluation of Aspect Based Sentiment Analysis in Telugu, a Low Resource Language	Yashwanth Reddy Regatte, Rama Rohit Reddy Gangula and Radhika Mamidi
707	KOTONOHA: A Corpus Concordance System for Skewer-Searching NINJAL Corpora	Teruaki Oka, Yuichi Ishimoto, Yutaka Yagi, Takenori Nakamura, Masayuki Asahara, Kikuo Maekawa, Toshinobu Ogiso, Hanae Koiso, Kumiko Sakoda and Nobuko Kibe
708	Gamification Platform for Collecting Task-oriented Dialogue Data	Haruna Ogawa, Hitoshi Nishikawa, Takenobu Tokunaga and Hikaru Yokono
709	A Lexicon-Based Approach for Detecting Hedges in Informal Text	Jumayel Islam, Lu Xiao and Robert E. Mercer
710	An Analysis of Massively Multilingual Neural Machine Translation for Low-Resource Languages	Aaron Mueller, Garrett Nicolai, Arya D. McCarthy, Dylan Lewis, Winston Wu and David Yarowsky
714	NLP Scholar: A Dataset for Examining the State of NLP Research	Saif Mohammad
718	TRopBank: Turkish PropBank V2.0	Neslihan Kara, Deniz Baran Aslan, Büşra Marşan, Özge Bakay, Koray Ak and Olcay Taner Yıldız
720	AlloSat: A New Call Center French Corpus for Affect Analysis	Manon Macary, Marie Tahon, Yannick Estève and Anthony Rousseau
727	ScienceExamCER: A High-Density Fine-Grained Science-Domain Corpus for Common Entity Recognition	Hannah Smith, Zeyu Zhang, John Culnan and Peter Jansen
728	Word Complexity Estimation for Japanese Lexical Simplification	Daiki Nishihara and Tomoyuki Kajiwara
729	Improving the Production Efficiency and Well-formedness of Automatically-Generated Multiple-Choice Cloze Vocabulary Questions	Ralph Rose
730	LinCE: A Centralized Benchmark for Linguistic Code-switching Evaluation	Gustavo Aguilar, Sudipta Kar and Thamar Solorio
733	SMASH Corpus: A Spontaneous Speech Corpus Recording Third-person Audio Commentaries on Gameplay	Yuki Saito, Shinnosuke Takamichi and Hiroshi Saruwatari
734	SAPPHIRE: Simple Aligner for Phrasal Paraphrase with Hierarchical Representation	Masato Yoshinaka, Tomoyuki Kajiwara and Yuki Arase
737	WN-Salience: A Corpus of News Articles with Entity Salience Annotations	Chuan Wu, Evangelos Kanoulas, Maarten de Rijke and Wei Lu
738	TDDC: Timely Disclosure Documents Corpus	Nobushige Doi, Yusuke Oda and Toshiaki Nakazawa
739	Implicit Knowledge in Argumentative Texts: An Annotated Corpus	Maria Becker, Katharina Korfhage and Anette Frank
741	Swiss-AL: A Multilingual Swiss Web Corpus for Applied Linguistics	Julia Krasselt, Philipp Dressen, Matthias Fluor, Cerstin Mahlow, Klaus Rothenhäusler and Maren Runte
744	Extending Universal Semantic Tags	Da Huo and Gerard de Melo
745	NorNE: Annotating Named Entities for Norwegian	Fredrik Jørgensen, Tobias Aasmoe, Anne-Stine Ruud Husevåg, Lilja Øvrelid and Erik Velldal
746	Improving Sentence Boundary Detection for Spoken Language Transcripts	Ines Rehbein, Josef Ruppenhofer and Thomas Schmidt
747	Event Extraction from Unstructured Amharic Text	ephrem tadesse, Rosa Tsegaye and Kuulaa Qaqqabaa
748	Orthographic Codes and the Neighborhood Effect: Lessons from Information Theory	Stephan Tulkens, Dominiek Sandra and Walter Daelemans
752	The BiodivTagger: Ontology-Based Information Extraction for Scholarly Data in Biodiversity Research	Felicitas Löffler, Nora Abdelmageed, Samira Babalou, Pawandeep Kaur and Birgitta König-Ries
753	Improving Speech Recognition for the Elderly: A New Corpus of Elderly Japanese Speech and Investigation of Acoustic Modeling for Speech Recognition	Meiko Fukuda, Hiromitsu Nishizaki, Yurie Iribe, Ryota Nishimura and Norihide Kitaoka
754	MorphAGram, Evaluation and Framework for Unsupervised Morphological Segmentation	Ramy Eskander, Elizabeth Nichols, Judith Klavans and Smaranda Muresan
755	Comparing Machine Learning and Deep Learning Approaches on NLP Tasks for the Italian Language	Bernardo Magnini, Alberto Lavelli and Simone Magnolini
757	A Process-oriented Dataset of Revisions during Writing	Rianne Conijn, Emily Dux Speltz, Menno van Zaanen, Luuk Van Waes and Evgeny Chukharev-Hudilainen
758	Corpus Query Lingua Franca – part II: Ontology	Stefan Evert, Oleg Harlamov, Philipp Heinrich and Piotr Banski
759	A Fine-grained Sentiment Dataset for Norwegian	Lilja Øvrelid, Petter Mæhlum, Jeremy Barnes and Erik Velldal
760	Text and Speech-based Tunisian Arabic Sub-Dialects Identification	Najla Ben Abdallah, Saméh Kchaou and Fethi Bougares
761	Multiple Knowledge GraphDB (MKGDB)	Farid Yusifli, Stefano Faralli and Paola Velardi
763	PACO: a corpus to analyze the impact of common ground in spontaneous face-to-face interaction	Mary AMOYAL, Béatrice Priego-Valverde and Stephane Rauzy
766	Towards a Versatile Medical-Annotation Guideline Feasible Without Heavy Medical Knowledge: Starting From Critical Lung Diseases	Shuntaro Yada, Ayami Joh, Ribeka Tanaka, Fei Cheng, Eiji ARAMAKI and Sadao Kurohashi
769	Dialogue Act Annotation in a Multimodal Corpus of First Encounter Dialogues	Costanza Navarretta and Patrizia Paggio
771	A Conversation-Analytic Annotation of Turn-Taking Behavior in Japanese Multi-Party Conversation and its Preliminary Analysis	Mika Enomoto, Yasuharu Den and Yuichi Ishimoto
772	TED-Q: TED Talks and the Questions they Evoke	Matthijs Westera, Laia Mayol and Hannah Rohde
773	Learning the Human Judgment for the Automatic Evaluation of Chatbot	Shih-Hung Wu and Sheng-Lun Chien
774	Collection and Annotation of the Romanian Legal Corpus	Dan Tufiș, Maria Mitrofan, Vasile Păiș, Radu Ion and Andrei Coman
775	Training a Swedish Constituency Parser on Six Incompatible Treebanks	Richard Johansson and Yvonne Adesam
777	An empirical evaluation of annotation practices in corpora from languagedocumentation	Kilu von Prince and Sebastian Nordhoff
779	Towards a Reliable and Robust Methodology for Crowd-Based Subjective Quality Assessment of Query-Based Extractive Text Summarization	Neslihan Iskender, Tim Polzehl and Sebastian Möller
780	Building the Spanish-Croatian Parallel Corpus	Bojana Mikelenić and Marko Tadić
782	From Witch’s Shot to Music Making Bones - Resources for Medical Laymen to Technical Language and Vice Versa	Laura Seiffe, Oliver Marten, Michael Mikhailov, Sven Schmeier and Roland Roller
784	Paraphrase Generation and Evaluation on Colloquial-Style Sentences	Eetu Sjöblom, Mathias Creutz and Yves Scherrer
785	Representing Verbs with Visual Argument Vectors	Irene Sucameli and Alessandro Lenci
786	A Seed Corpus of Hindu Temples in India	Priya Radhakrishnan
789	Annotated Corpus for Sentiment Analysis in Odia Language	Gaurav Mohanty, Pruthwik Mishra and Radhika Mamidi
790	DerivBase.Ru: a Derivational Morphology Resource for Russian	Daniil Vodolazsky
793	Creating a Dataset for Named Entity Recognition in the Archaeology Domain	Alex Brandsen, Suzan Verberne, Milco Wansleeben and Karsten Lambers
796	Urdu Pitch Accents and Intonation Patterns in Spontaneous Conversational Speech	Luca Rognoni, Judith Bishop, Miriam Corris, Jessica Fernando and Rosanna Smith
797	The DReaM Corpus: A Multilingual Annotated Corpus of Grammars for the World’s Languages	Shafqat Mumtaz Virk, Harald Hammarström, Markus Forsberg and Søren Wichmann
798	MyFixit: An Annotated Dataset, Annotation Tool, and Baseline Methods for Information Extraction from Repair Manuals	Nima Nabizadeh, Dorothea Kolossa and Martin Heckmann
799	Development of a Medical Incident Report Corpus with Intention and Factuality Annotation	Hongkuan Zhang, Ryohei Sasano, Koichi Takeda and Zoie Shui-Yee Wong
800	IndicSpeech: Text-to-Speech Corpus for Indian Languages	Nimisha Srivastava, Rudrabha Mukhopadhyay, Prajwal K R and C V Jawahar
802	Analysis of GlobalPhone and Ethiopian Languages Speech Corpora for Multilingual ASR	Martha Yifiru Tachbelie, Solomon Teferra Abate and Tanja Schultz
805	LexiDB: Patterns & Methods for Corpus Linguistic Database Management	Matthew Coole, Paul Rayson and John Mariani
806	Building a Task-oriented Dialog System for languages with no training data	Maddalen López de Lacalle, Xabier Saralegi and Iñaki San Vicente
807	Towards Entity Spaces	Marieke van Erp and Paul Groth
808	An HMM Approach with Inherent Model Selection for Sign Language and Gesture Recognition	Sandrine Tornay, Oya Aran and Mathew Magimai Doss
809	Abstractive Text Summarization based on Language Model Conditioning and Locality Modeling	Dmitrii Aksenov, Julian Moreno-Schneider, Peter Bourgonje, Robert Schwarzenberg, Leonhard Hennig and Georg Rehm
810	Using Automatic Speech Recognition in Spoken Corpus Curation	Jan Gorisch, Michael Gref and Thomas Schmidt
811	Analyzing Word Embedding using Structural Equation Modeling	Namgi Han, Katsuhiko Hayashi and Yusuke Miyao
812	SENCORPUS: A Multilingual Parallel Corpus between Senegalese Languages and Western Languages	Elhadji Mamadou Nguer, Alla Lo, Cheikh M. Bamba Dione, Sileye O. Ba and Moussa Lo
815	Orchestrating NLP Services for the Legal Domain	Julian Moreno-Schneider, Georg Rehm, Elena Montiel-Ponsoda, Víctor Rodriguez-Doncel, Artem Revenko, Sotirios Karampatakis, Maria Khvalchik, Christian Sageder, Jorge Gracia and Filippo Maganza
816	WAC: A Corpus of Wikipedia Conversations for Online Abuse Detection	Noé Cécillon, Vincent Labatut, Richard Dufour and Georges Linarès
817	CzeDLex 0.6 and its Representation in the PML-TQ	Jiří Mírovský, Lucie Poláková and Pavlína Synková
818	Understanding User Utterances in a Dialog System for Caregiving	Yoshihiko Asao, Julien Kloetzer, Junta Mizuno, Dai Saiki, Kazuma Kadowaki and Kentaro Torisawa
819	A CLARIN Transcription Portal for Interview Data	Christoph Draxler, Henk van den Heuvel, Arjan van Hessen, Silvia Calamai and Louise Corti
821	Parsing as Tagging	Robert Vacareanu, George Caique Gouveia Barbosa, Marco A. Valenzuela-Escárcega and Mihai Surdeanu
822	Multilingualization of Medical Terminology: Semantic and Structural Embedding Approaches	Long-Huei Chen and Kyo Kageura
823	A Major Wordnet for a Minority Language: Scottish Gaelic	Gábor Bella, Fiona McNeill, Rody Gorman, Caoimhin O Donnaile, Kirsty MacDonald, Yamini Chandrashekar, Abed Alhakim Freihat and Fausto Giunchiglia
824	A Chinese Sarcasm Dataset	Xiaochang Gong, Qin Zhao, Jun Zhang, Ruibin Mao and Ruifeng Xu
825	The EDGeS Diachronic Bible Corpus	Gerlof Bouma, Evie Coussé, Trude Dijkstra and Nicoline van der Sijs
826	Ellogon Casual Annotation Infrastructure	Georgios Petasis
827	Love Me, Love Me, Say (and Write!) that You Love Me: Enriching the WASABI Song Corpus with Lyrics Annotations	Michael Fell, Elena Cabrio, Elmahdi Korfed, Michel Buffa and Fabien Gandon
830	Integrating Disfluency-based and Prosodic Features with Acoustics in Automatic Fluency Evaluation of Spontaneous Speech	Huaijin Deng, Youchao Lin, Takehito Utsuro, Akio Kobayashi, Hiromitsu Nishizaki and Junichi Hoshino
832	LiViTo: linguistic and visual features tool for assisted analysis of historic manuscripts	Klaus Müller, Aleksej Tikhonov and Roland Meyer
833	COSTRA 1.0: A Dataset of Complex Sentence Transformations	Petra Barancikova and Ondřej Bojar
834	VROAV: Using Iconicity to Visually Represent Abstract Verbs	Simone Scicluna and Carlo Strapparava
840	Are White Ravens Ever White? - Non-Literal Adjective-Noun Phrases in Polish	Agnieszka Mykowiecka and Malgorzata Marciniak
842	Class-based LSTM Russian Language Model with Linguistic Information	Irina Kipyatkova and Alexey Karpov
844	MEDIAPI-SKEL - A 2D-Skeleton Video Database of French Sign Language With Aligned French Subtitles	Hannah Bull, Annelies Braffort and Michèle Gouiffès
845	TextAnnotator: A UIMA based tool for simultaneous and collaborative annotation of texts	Giuseppe Abrami, Manuel Stoeckel and Alexander Mehler
847	European Language Grid: An Overview	Georg Rehm, Maria Berger, Ela Elsholz, Stefanie Hegele, Florian Kintzel, Katrin Marheinecke, Stelios Piperidis, Miltos Deligiannis, Dimitris Galanis, Katerina Gkirtzou, Penny Labropoulou, Kalina Bontcheva, David Jones, Ian Roberts, Jan Hajic, Jana Hamrlová, Lukáš Kačena, Khalid Choukri, Victoria Arranz, Andrejs Vasiļjevs, Orians Anvari, Andis Lagzdiņš, Jūlija Meļņika, Gerhard Backfried, Erinç Dikici, Miroslav Janosik, Katja Prinz, Christoph Prinz, Severin Stampler, Dorothea Thomas-Aniola, Jose Manuel Gomez Perez, Andres Garcia Silva, Christian Berrío, Ulrich Germann, Steve Renals and Ondrej Klejch
848	Deduplication of scholarly documents using locality sensitive hashing and word embeddings	Bikash Gyawali, Lucas Anastasiou and Petr Knoth
850	Automated Writing Support Using Deep Linguistic Parsers	Luís Morgado da Costa, Roger V P Winder, Shu Yun Li, Benedict Christopher Lin Tzer Liang, Joseph Mackinnon and Francis Bond
852	CTAP for Italian: Integrating Components for the Analysis of Italian into a Multilingual Linguistic Complexity Analysis Tool	Nadezda Okinina and Jennifer-Carmen Frey
853	Do you Feel Certain about your Annotation? A Web-based Semantic Frame Annotation Tool Considering Annotators’ Concerns and Behaviors	Regina Stodden and Behrang QasemiZadeh
854	FloDusTA: Saudi Tweets Dataset for Flood, Dust Storm, and Traffic Accident Events	Btool Hamoui, Mourad Mars and Khaled Almotairi
855	Large Vocabulary Read Speech Corpora for Four Ethiopian Languages: Amharic, Tigrigna, Oromo and Wolaytta	Solomon Teferra Abate, Martha Yifiru Tachbelie, Michael Melese, Hafte Abera, Tewodros Abebe, Wondwossen Mulugeta, Yaregal Assabie, Million Meshesha, Solomon Afnafu and Binyam Ephrem Seyoum
859	The Competitiveness Analysis of the European Language Technology Market	Andrejs Vasiļjevs, Inguna Skadina, Indra Samite, Kaspars Kauliņš, Ēriks Ajausks, Jūlija Meļņika and Aivars Bērziņš
860	Adaptation of Deep Bidirectional Transformers for Afrikaans Language	Sello Ralethe
861	Toxic, Hateful, Offensive or Abusive? What Are We Really Classifying? An Empirical Analysis of Hate Speech Datasets	Paula Fortuna, Juan Soler and Leo Wanner
862	Much Ado About Nothing – Identification of Zero Copulas in Hungarian Using an NMT Model	Andrea Dömötör, Zijian Győző Yang and Attila Novák
866	Preparation of Bangla Speech Corpus from Publicly Available Audio & Text	Shafayat Ahmed, Nafis Sadeq, Sudipta Saha Shubha, Md. Nahidul Islam, Muhammad Abdullah Adnan and Mohammad Zuberul Islam
867	Designing Multilingual Interactive Agents using Small Dialogue Corpora	Donghui Lin, Masayuki Otani, Ryosuke Okuno and Toru Ishida
868	TLT-school: a Corpus of Non Native Children Speech	Roberto Gretter, Marco Matassoni, Stefano Bannò and Falavigna Daniele
869	Do You Believe It Happened? Assessing Chinese Readers' Veridicality Judgments	Yu-Yun Chang and Shu-Kai HSIEH
872	Morfessor EM+Prune: Improved Subword Segmentation with Expectation Maximization and Pruning	Stig-Arne Grönroos, Sami Virpioja and Mikko Kurimo
873	Automatic In-the-wild Dataset Annotation with Deep Generalized Multiple Instance Learning	Joana Correia, Isabel Trancoso and Bhiksha Raj
874	Offensive Video Detection: Dataset and Baseline Results	Cleber Alcântara, Viviane Moreira and Diego Feijo
875	Treebanking User-Generated Content: A Proposal for a Unified Representation in Universal Dependencies	Manuela Sanguinetti, Cristina Bosco, Lauren Cassidy, Özlem Çetinoğlu, Alessandra Teresa Cignarella, Teresa Lynn, Ines Rehbein, Josef Ruppenhofer, Djamé Seddah and Amir Zeldes
879	Crowdsourcing Speech Data for Low-Resource Languages from Low-Income Workers	Basil Abraham, Danish Goel, Divya Siddarth, Kalika Bali, Manu Chopra, Monojit Choudhury, Pratik Joshi, Preethi Jyoti, Sunayana Sitaram and Vivek Seshadri
880	On Construction of the ASR-oriented Indian English Pronunciation Dictionary	Xian Huang, Xin Jin, Qike Li and Keliang Zhang
881	An Annotated Corpus for Sexism Detection in French Tweets	Patricia Chiril, Véronique MORICEAU, Farah Benamara, Alda Mari, Gloria Origgi and Marlène Coulomb-Gully
882	Rigor Mortis: Annotating MWEs with a Gamified Platform	Karën Fort, Bruno Guillaume, Yann-Alan Pilatte, Mathieu Constant and Nicolas Lefèbvre
884	Chinese Financial News Annotation For Target-based Sentiment Analysis	Chaofa Yuan, Yuhan Liu, Rongdi Yin, Jun Zhang, Qinling Zhu, Ruibin Mao and Ruifeng Xu
887	Multi-domain Tweet Corpora for Sentiment Analysis: Resource Creation and Evaluation	Mamta ., Asif Ekbal, Pushpak Bhattacharyya, Vipin Tyagi, Shikha Srivastava and Tista Saha
889	“Voices of the Great War”: A Richly Annotated Corpus of Italian Texts on the First World War	Federico Boschetti, irene de felice, Stefano Dei Rossi, Felice Dell'Orletta, Michele Di Giorgio, Martina Miliani, Lucia C. Passaro, Angelica Puddu, Giulia Venturi, Nicola Labanca, Alessandro Lenci and Simonetta Montemagni
890	I Feel Offended, Don’t Be Abusive! Implicit/Explicit Messages in Offensive and Abusive Language	Tommaso Caselli, Valerio Basile, Jelena Mitrović, Inga Kartoziya and Michael Granitzer
891	Korean-Specific Emotion Annotation Procedure Using N-gram based Distant Supervision and Korean-Specific Features based Distant Supervision	Young-Jun Lee
892	Semi-Automatic Construction and Refinement of Annotated Corpus for Deep Learning-based Emotion Classification	Jiajun Xu, Kyosuke Masuda, Hiromitsu Nishizaki, Fumiyo Fukumoto and Yoshimi Suzuki
893	MuST-Cinema: a Speech-to-Subtitles corpus	Alina Karakanta, Matteo Negri and Marco Turchi
894	GerDraCor-Coref: A Coreference Corpus for Dramatic Texts in German	Janis Pagel and Nils Reiter
895	ProGene - A Large-scale, High-Quality Protein-Gene Annotated Corpus for Supervised Learning	Erik Faessler, Luise Modersohn, Christina Lohr and Udo Hahn
896	FlauBERT: Unsupervised Language Model Pre-training for French	Hang Le, Loïc Vial, Jibril Frej, Vincent Segonne, Maximin Coavoux, Benjamin Lecouteux, Alexandre Allauzen, Benoit Crabbé, Laurent Besacier and Didier Schwab
898	Towards a Semi-Automatic Detection of Reflexive and Reciprocal Constructions and Their Representation in a Valency Lexicon	Václava Kettnerová, Marketa Lopatkova, Anna Vernerová and Petra Barancikova
899	A Study on Entity Resolution for Email Conversations	Parag Pravin Dakle, Takshak Desai and Dan Moldovan
900	How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR	Phillip Benjamin Ströbel, Simon Clematide and Martin Volk
901	A Generic Approach for Mass-Producing Language Resources by Combining Implicit Crowdsourcing and Language Learning	Lionel Nicolas, Verena Lyding, Claudia Borg, Corina Forascu, Karën Fort, Katerina Zdravkova, Iztok Kosem, Jaka Čibej, Špela Arhar Holdt, Alice Millour, Alexander König, Christos Rodosthenous, Federico Sangati, Umair ul Hassan, Anisia Katinskaia, Anabela Barreiro and Yaakov HaCohen-Kerner
904	A Diachronic Treebank of Russian Spanning More Than a Thousand Years	Aleksandrs Berdicevskis and Hanne Eckhoff
906	MAGPIE: A Large Corpus of Potentially Idiomatic Expressions	Hessel Haagsma, Johan Bos and Malvina Nissim
907	A fine-grained Emotion Corpus of Real Life Suicide Notes in English	Soumitra Ghosh, Asif Ekbal and Pushpak Bhattacharyya
908	Accelerated High-Quality Mutual-Information Based Word Clustering	Manuel R. Ciosici, Ira Assent and Leon Derczynski
910	Languages Resources for Poorly Endowed Languages : The Case Study of Classical Armenian	Chahan Vidal-Gorène and Aliénor Decours-Perez
911	Multimodal corpus of bidirectional conversation of human-human and human-robot interaction during fMRI scanning	Birgit Rauchbauer, Youssef Hmamouche, Laurent Prévot, Magalie Ochs and Thierry Chaminade
912	ÆTHEL: Automatically Extracted Type-Logical Derivations for Dutch	Konstantinos Kogkalidis, Michael Moortgat and Richard Moot
913	Training a Broad-Coverage German Sentiment Classification Model for Dialog Systems	Oliver Guhr, Anne-Kathrin Schumann, Frank Bahrmann and Hans Joachim Böhme
914	Evaluation of Lifelong Learning Systems	Yevhenii Prokopalo, Sylvain Meignier, Olivier Galibert, loic barrault and Anthony Larcher
915	A Data Set for the Analysis of Text Quality Dimensions in Summarization Evaluation	Margot Mieskes, Eneldo Loza Mencía and Tim Kronsbein
916	Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian	Ranka Stankovic, Branislava Šandrih, Cvetana Krstev, Miloš Utvić and Mihailo Skoric
918	A Resource for Studying Chatino Verbal Morphology	Hilaria Cruz, Antonios Anastasopoulos and Gregory Stump
919	The Brain-IHM Dataset: a New Resource for Studying the Brain Basis of Human-Human and Human-Machine Conversations	Magalie Ochs, Roxane Bertrand, Aurélie Goujon, Deirdre Bolger, Anne-Sophie Dubarry and Philippe Blache
921	Chat or Learn: a Data-Driven Robust Question-Answering System	Gabriel Luthier and Andrei Popescu-Belis
922	A Multi-Platform Arabic News Comment Dataset for Offensive Language Detection	Shammur Absar Chowdhury, Hamdy Mubarak, Ahmed Abdelali, Soon-gyo Jung, Bernard J Jansen and Joni Salminen
923	Evaluating Information Loss in Temporal Dependency Trees	Mustafa Ocal and Mark Finlayson
924	Populating Legal Ontologies using Semantic Role Labeling	Llio Humphreys, Guido Boella, Luigi Di Caro, Livio Robaldo, Leon van der Torre, Sepideh Ghanavati and Robert Muthuri
927	Seq2SeqPy: A Lightweight and Customizable Toolkit for Neural Sequence-to-Sequence Modeling	Raheel Qader, François Portet and Cyril Labbe
928	An Event-comment Social Media Corpus for Implicit Emotion Analysis	Sophia Yat Mei Lee and Helena Yan Ping Lau
929	Corpus for Modeling User Interactions in Online Persuasive Discussions	Ryo Egawa, Gaku Morio and Katsuhide Fujita
931	Constructing Web-Accessible Semantic Role Labels and Frames for Japanese as Additions to the NPCMJ Parsed Corpus	Koichi Takeuchi, Alastair Butler, Iku Nagasaki, Takuya Okamura and Prashant Pardeshi
933	Fine-grained Morphosyntactic Analysis and Generation Tools for More Than One Thousand Languages	Garrett Nicolai, Dylan Lewis, Arya D. McCarthy, Aaron Mueller, Winston Wu and David Yarowsky
934	PST 2.0 – Corpus of Polish Spatial Texts	Michał Marcińczuk, Marcin Oleksy and Jan Wieczorek
938	Large-scale Cross-lingual Language Resources for Referencing and Framing	Piek Vossen, Filip Ilievski, Marten Postma, Antske Fokkens, Gosse Minnema and Levi Remijnse
939	Measuring the Impact of Readability Features in Fake News Detection	Roney Santos, Gabriela Pedro, Sidney Leal, Oto Vale, Thiago Pardo, Kalina Bontcheva and Carolina Scarton
940	Twitter Trend Extraction: A Graph-based Approach for Tweet and Hashtag Ranking, Utilizing No-Hashtag Tweets	zahra majdabadi, Behnam Sabeti, Preni Golazizian, Seyed Arad Ashrafi Asli, Omid Momenzadeh and reza fahmi
943	Leveraging Contextual Embeddings for Detecting Diachronic Semantic Shift	Matej Martinc, Petra Kralj Novak and Senja Pollak
944	Profiling-UD: a Tool for Linguistic Profiling of Texts	Dominique Brunato, Giulia Venturi, Felice Dell'Orletta and Andrea Cimino
945	EstNLTK 1.6: Remastered Estonian NLP Pipeline	Sven Laur, Siim Orasmaa, Dage Särg and Paul Tammo
946	A Tree Extension for CoNLL-RDF	Christian Chiarcos and Luis Glaser
949	Evaluation Dataset and Methodology for Extracting Application-Specific Taxonomies from the Wikipedia Knowledge Graph	Georgeta Bordea, Stefano Faralli, Fleur Mougin, Paul Buitelaar and Gayo Diallo
950	Learnings from Technological Interventions in a Low Resource Language: A Case-Study on Gondi	Devansh Mehta, Sebastin Santy, Ramaravind Kommiya Mothilal, Brij Mohan Lal Srivastava, Alok Sharma, Anurag Shukla, Vishnu Prasad, Venkanna U, Amit Sharma and Kalika Bali
952	Project PIAF: Building a Native French Question-Answering Dataset	Rachel Keraron, Guillaume Lancrenon, Mathilde Bras, Frédéric Allary, Gilles Moyse, Thomas Scialom, Edmundo-Pavel Soriano-Morales and Jacopo Staiano
954	DNN-based Speech Synthesis Using Abundant Tags of Spontaneous Speech Corpus	Yuki Yamashita, Tomoki Koriyama, Yuki Saito, Shinnosuke Takamichi, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari
955	GUMBY – A Free, Balanced, and Rich English Web Corpus	Luke Gessler, Siyao Peng, Yang Liu, Yilun Zhu, Shabnam Behzad and Amir Zeldes
956	Model-based annotation of coreference	Rahul Aralikatte and Anders Søgaard
958	Summarization Beyond News: The Automatically Acquired Fandom Corpora	Benjamin Hättasch, Nadja Geisler, Christian M. Meyer and Carsten Binnig
959	A French Corpus for Event Detection on Twitter	Béatrice Mazoyer, Julia Cagé, Nicolas Hervé and Céline Hudelot
962	Gender Representation in Open Source Speech Resources	Mahault Garnerin, Solange Rossato and Laurent Besacier
966	CRWIZ: A Framework for Crowdsourcing Real-Time Wizard-of-Oz Dialogues	Francisco Javier Chiyah Garcia, José Lopes, Xingkun Liu and Helen Hastie
968	DaNE: A Named Entity Resource for Danish	Rasmus Hvingelby, Amalie Brogaard Pauli, Maria Barrett, Christina Rosted, Lasse Malm Lidegaard and Anders Søgaard
969	Incorporating Politeness across Languages in Customer Care Responses: Towards building a Multi-lingual Empathetic Dialogue Agent	Mauajama Firdaus, Asif Ekbal and Pushpak Bhattacharyya
970	Lemmatising Middle English Corpora: The Benefit of Enriching the Penn-Helsinki Parsed Corpus of Middle English 2 (PPCME2), the Parsed Corpus of Middle English Poetry (PCMEP), and A Parsed Linguistic Atlas of Early Middle English (PLAEME)	Carola Trips and Michael Percillier
974	Effort Estimation in Named Entity Tagging Tasks	Inês Gomes, Rui Correia, Jorge Ribeiro and João Freitas
978	Adding Gesture, Posture and Facial Displays to the PoliModal Corpus of Political Interviews	Daniela Trotta, Alessio Palmero Aprosio, Sara Tonelli and Annibale Elia
980	Constructing a Bilingual Hadith Corpus Using a Segmentation Tool	Shatha Altammami, Eric Atwell and Ammar Alsalka
982	Subjective evaluation of comprehensibility in movies interactions	Estelle Randria, Lionel Fontan, Maxime Le Coz, Isabelle Ferrané and Julien Pinquier
985	Reproduction and Revival of the Argument Reasoning Comprehension Task	João António Rodrigues, Ruben Branco, João Silva and António Branco
989	Fine-grained Named Entity Annotations for German Biographic Interviews	Josef Ruppenhofer, Ines Rehbein and Carolina Flinz
991	CoCo: A Tool for Automatically Assessing Conceptual Complexity of Texts	Sanja Štajner, Sergiu Nisioi and Ioana Hulpuș
994	An Emotional Mess! Deciding on a Framework for Building a Dutch Emotion-Annotated Corpus	Luna De Bruyne, Orphee De Clercq and Veronique Hoste
996	WikiBank: Using Wikidata to Improve Multilingual Frame-Semantic Parsing	Cezar Sas, Meriem Beloucif and Anders Søgaard
997	When Shallow is Good Enough: Automatic Assessment of Conceptual Text Complexity using Shallow Semantic Features	Sanja Štajner and Ioana Hulpuș
999	E:Calm Resource: a Resource for Studying Texts Produced by French Pupils and Students	Lydia-Mai Ho-Dac, Serge Fleury and Claude Ponton
1000	Representing Multiword Term Variation in a Terminological Knowledge Base: a Corpus-Based Study	Pilar León-Araúz, Arianne Reimerink and Melania Cabezas-García
1001	On Context Span Needed for Machine Translation Evaluation	Sheila Castilho, Maja Popović and Andy Way
1002	DecOp: A Multilingual and Multi-domain Corpus For Detecting Deception In Typed Text	Pasquale Capuozzo, Ivano Lauriola, Carlo Strapparava, Fabio Aiolli and Giuseppe Sartori
1003	A Multilingual Parallel Corpora Collection Effort for Indian Languages	Shashank Siripragrada, Jerin Philip, Vinay P. Namboodiri and C V Jawahar
1004	Dirichlet-Smoothed Word Embeddings for Low-Resource Settings	Jakob Jungmaier, Nora Kassner and Benjamin Roth
1005	CoSimLex: A Resource for Evaluating Graded Word Similarity in Context	Carlos Santos Armendariz, Matthew Purver, Matej Ulčar, Senja Pollak, Nikola Ljubešić and Mark Granroth-Wilding
1009	Minority Positive Sampling for Switching Points - an Anecdote for the Code-Mixing Language Modeling	Arindam Chatterjere, Vineeth Guptha, Parul Chopra and Amitava Das
1010	Irony Detection in Persian Language: A Transfer Learning Approach Using Emoji Prediction	Preni Golazizian, Behnam Sabeti, Seyed Arad Ashrafi Asli, zahra majdabadi, Omid Momenzadeh and reza fahmi
1011	Towards Computational Resource Grammars for Runyankore and Rukiga	David Bamutura, Peter Ljunglöf and Peter Nebende
1013	A French Version of the FraCaS Test Suite	Maxime Amblard, Clément Beysson, Philippe de Groote, Bruno Guillaume and Sylvain Pogodalla
1014	Arabic Speech Rhythm Corpus: Read and Spontaneous Speaking Styles	Omnia Ibrahim, Homa Asadi, Eman Kassem and Volker Dellwo
1015	Optimizing Annotation Effort Using Active Learning Strategies: A Sentiment Analysis Case Study in Persian	Seyed Arad Ashrafi Asli, Behnam Sabeti, zahra majdabadi, Preni Golazizian, reza fahmi and Omid Momenzadeh
1016	Do You Really Want to Hurt Me? Predicting Abusive Swearing in Social Media	Endang Wahyu Pamungkas, Valerio Basile and Viviana Patti
1017	Rhythmic Proximity Between Natives And Learners Of French - Evaluation of a metric based on the CEFC corpus	Sylvain Coulange and Solange Rossato
1018	Facilitating Corpus Usage: Making Icelandic Corpora More Accessible for Researchers and Language Users	Steinþór Steingrímsson, Starkaður Barkarson and Gunnar Thor Örnólfsson
1020	Automatic Compilation of Resources for Academic Writing and Evaluating with Informal Word Identification and Paraphrasing System	Seid Yimam, Gopalakrishnan Venkatesh, John Lee and Chris Biemann
1021	Cross-lingual and cross-domain evaluation of Machine Reading Comprehension with Squad and CALOR-Quest corpora	Delphine Charlet, Geraldine Damnati, Frederic Bechet, gabriel marzinotto and Johannes Heinecke
1023	Interoperability in an Infrastructure Enabling Multidisciplinary Research: The case of CLARIN	Franciska de Jong, Bente Maegaard, Darja Fišer, Dieter van Uytvanck and Andreas Witt
1025	Natural Language Premise Selection: Finding Supporting Statements for Mathematical Text	Deborah Ferreira and André Freitas
1026	DEbateNet-mig15:Tracing the 2015 Immigration Debate in Germany Over Time	Gabriella Lapesa, Andre Blessing, Nico Blokker, Erenay Dayanik, Sebastian Haunss, Jonas Kuhn and Sebastian Padó
1027	PyVallex: A Processing System for Valency Lexicon Data	Jonathan Verner and Anna Vernerová
1030	Cairo Student Code-Switch (CSCS) Corpus: An Annotated Egyptian Arabic-English Corpus	Mohamed Balabel, Injy Hamed, Slim Abdennadher, Ngoc Thang Vu and Özlem Çetinoğlu
1033	Dialogue-AMR: Abstract Meaning Representation for Dialogue	Claire Bonial, Lucia Donatelli, Mitchell Abrams, Stephanie M. Lukin, Stephen Tratz, Matthew Marge, Ron Artstein, David Traum and Clare Voss
1035	ScholarlyRead: A New Dataset for Scientific Article Reading Comprehension	Tanik Saikh, Asif Ekbal and Pushpak Bhattacharyya
1038	A corpus of Spanish political speeches from 1937 to 2018	Elena Álvarez-Mellado
1039	Contextualized Embeddings based Transformer Encoder for Sentence Similarity Modeling in Answer Selection Task	Md Tahmid Rahman Laskar, Jimmy Huang and Enamul Hoque
1040	Understanding Spatial Relations through Multiple Modalities	Soham Dan, Hangfeng He and Dan Roth
1041	To Case or not to case: Evaluating Casing Methods for Neural Machine Translation	Thierry Etchegoyhen and Harritxu Gete
1042	Odinson: A Fast Rule-based Information Extraction Framework	Marco A. Valenzuela-Escárcega, Gus Hahn-Powell and Dane Bell
1043	A New Latin Treebank for Universal Dependencies: Charters between Ancient Latin and Romance Languages	Flavio Massimiliano Cecchini, Timo Korkiakangas and Marco Passarotti
1044	The Ontology of Bulgarian Dialects – architecture and information retrieval	Rositsa Dekova
1045	Automatic Speech Recognition for Uyghur through Multilingual Acoustic Modelling	Ayimunishagu Abulimiti and Tanja Schultz
1046	Getting More Data for Low-resource Morphological Inflection: Language Models and Data Augmentation	Alexey Sorokin
1049	Comparing methods for measuring dialect similarity in Norwegian	Janne Johannessen, Andre Kåsen, Kristin Hagen, Anders Nøklestad and Joel Priestley
1051	The MARCELL Legislative Corpus	Tamás Váradi, Svetla Koeva, Martin Yamalov, Marko Tadić, Bálint Sass, Bartłomiej Nitoń, Maciej Ogrodniczuk, Piotr Pęzik, Verginica Barbu Mititelu, Radu Ion, Elena Irimia, Maria Mitrofan, Vasile Păiș, Dan Tufiș, Radovan Garabík, Simon Krek, Andraz Repar and Matjaž Rihtar
1052	Language Technology Programme for Icelandic 2019-2023	Anna Nikulásdóttir, Jón Guðnason, Anton Karl Ingason, Hrafn Loftsson, Eiríkur Rögnvaldsson, Einar Freyr Sigurðsson and Steinþór Steingrímsson
1053	The Use of Lang-8 Learner Corpus in the Grammatical Error Correction for Russian	Viet Anh Trinh and Alla Rozovskaya
1054	ParaPat: The Multi-Million Sentences Parallel Corpus of Patents Abstracts	Felipe Soares, Mark Stevenson and Diego Bartolome
1055	Detecting Troll Tweets in a Bilingual Corpus	Lin Miao, Mark Last and Marina Litvak
1056	Age Recommendation for Texts	Alexis Blandin, Gwénolé Lecorvé, Delphine Battistelli and Aline Étienne
1059	Elaborating an Alignments Database for a Sign Language Concordancer	Marion Kaczmarek and Michael Filhol
1060	Editing OntoLex-Lemon in VocBench 3	Manuel Fiorelli, Armando Stellato, Tiziano Lorenzetti, Andrea Turbati, Peter Schmitz, Enrico Francesconi, Najeh Hajlaoui and Brahim Batouche
1064	Corpora for Document-Level Neural Machine Translation	Siyou Liu and Xiaojun Zhang
1065	Exploring Transformer Text Generation for Medical Dataset Augmentation	Ali Amin-Nejad, Julia Ive and Sumithra Velupillai
1066	Sense-Annotated Corpora for Word Sense Disambiguation in Multiple Languages and Domains	Bianca Scarlini, Tommaso Pasini and Roberto Navigli
1067	A Topic-Aligned Multilingual Corpus of Wikipedia Articles for Studying Information Asymmetry in Low Resource Languages	Dwaipayan Roy, Sumit Bhatia and Prateek Jain
1068	Privacy by Design and Language Resources	Pawel Kamocki and Andreas Witt
1069	Collecting Tweets to Investigate Regional Variation in Canadian English	Filip Miletic, Anne Przewozny-Desriaux and Ludovic Tanguy
1071	Pártélet: A Hungarian Corpus of Propaganda Texts from the Hungarian Socialist Era	Zoltán Kmetty, Veronika Vincze, Dorottya Demszky, Ring Orsolya, Balázs Nagy and Martina Katalin Szabó
1072	From Linguistic Resources to Ontology-Aware Terminologies: Minding the Representation Gap	Giulia Speranza, Maria Pia di Buono, Johanna Monti and Federico Sangati
1076	Modelling Etymology in LMF/TEI: The Grande Dicionário Houaiss da Língua Portuguesa Dictionary as a Use Case	Fahad Khan, Laurent Romary, Ana Salgado, Jack Bowers, Mohamed Khemakhem and Toma Tasovac
1078	DAICT: A Dialectal Arabic Irony Corpus Extracted From Twitter	Wajdi Zaghouani, Ines Abbes and Omaima El-Hardlo
1079	Norm It! Lexical Normalization for Italian and Its Downstream Effects for Dependency Parsing	Rob van der Goot, Alan Ramponi, Tommaso Caselli, Michele Cafagna and Lorenzo De Mattei
1081	Making Metadata Fit for Next Generation Language Technology Platforms: The Metadata Schema of the European Language Grid	Penny Labropoulou, Katerina Gkirtzou, Maria Gavriilidou, Miltos Deligiannis, Dimitris Galanis, Stelios Piperidis, Georg Rehm, Maria Berger, Valérie Mapelli, Michael Rigault, Victoria Arranz, Khalid Choukri, Gerhard Backfried, Jose Manuel Gomez Perez and Andres Garcia-Silva
1082	TArC: Incrementally and Semi-Automatically Collecting a Tunisian Arabish Corpus	elisa gugliotta and Marco Dinarelli
1083	Multilingual Corpus Creation for Multilingual Semantic Similarity Task	Mahtab Ahmed, Chahna Dixit, Robert E. Mercer, Atif Khan, Muhammad Rifayat Samee and Felipe Urra
1084	A Dataset for Detecting Fake News in Bengali	Md. Zobaer Hossain, Md. Ashraful Rahman, Md Saiful Islam and Sudipta Kar
1085	Relation between Degree of Empathy for Narrative Speech and Type of Responsive Utterance in Attentive listening	Koichiro Ito, Masaki Murata, Tomohiro Ohno and Shigeki Matsubara
1089	CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus	Changhan Wang, Juan Pino and Jiatao Gu
1091	Visual modeling of Turkish morphology	Berke Özenç and Ercan Solak
1092	OpusTools and Parallel Corpus Diagnostics	Mikko Aulamo, Umut Sulubacak, Sami Virpioja and Jörg Tiedemann
1093	French coreference for spoken and written language	Rodrigo Wilkens, Bruno Oberle, Frédéric Landragin and Amalia Todirascu
1094	Cross-lingual Zero Pronoun Resolution	Abdulrahman Aloraini and Massimo Poesio
1096	A Resource for Computational Experiments on Mapudungun	Mingjun Duan, Carlos Fasola, SaiKrishna Rallabandi, Rodolfo Vega, Antonios Anastasopoulos, Lori Levin and Alan W Black
1097	KORE 50^DYWC: An Evaluation Data Set for Entity Linking Based on DBpedia, YAGO, Wikidata and Crunchbase	Kristian Noullet, Rico Mix and Michael Färber
1098	TaPaCo: A Corpus of Sentential Paraphrases for 97 Languages	Yves Scherrer
1099	Small Town or Metropolis? Analyzing the Relationship between Population Size and Language	Amy Rechkemmer, Steven Wilson and Rada Mihalcea
1100	Literary Machine Translation under the Magnifying Glass: Assessing the Quality of an NMT-Translated Detective Novel on Document Level	Margot Fonteyne, Arda Tezcan and Lieve Macken
1104	Linking the TUFS Basic Vocabulary to the Open Multilingual Wordnet	Francis Bond, Hiroki Nomoto, Luís Morgado da Costa and Arthur Bond
1105	Invisible to People but not to Machines: Evaluation of Style-aware HeadlineGeneration in Absence of Reliable Human Judgment	Lorenzo De Mattei, Michele Cafagna, Felice Dell'Orletta and Malvina Nissim
1106	Intent Recognition in Doctor-Patient Interviews	Robin Rojoweic and Benjamin Roth
1107	Handle with Care: A Case Study in Comparable Corpora Exploitation for Neural Machine Translation	Thierry Etchegoyhen and Harritxu Gete
1108	RSC: A Romanian Read Speech Corpus for Automatic Speech Recognition	Alexandru-Lucian Georgescu, Horia Cucu, Andi Buzo and Corneliu Burileanu
1109	Interannotator Agreement for Lexico-Semantic Annotation of a Corpus	Elżbieta Hajnicz
1110	FrSemCor: Annotating a French corpus with supersenses	Lucie Barque, Pauline Haas, Richard Huyghe, Delphine Tribout, Marie Candito, Benoit Crabbé and Vincent Segonne
1111	WikiFactCheck: A Large Annotated Corpus of Claims and Cited Evidence Extracted from Wikipedia for Automatic Fact Checking	Aalok Sathe, Salar Ather, Tuan Manh Le, Nathan Perry and Joonsuk Park
1112	A Formal Analysis of Multimodal Referring Strategies Under Common Ground	Nikhil Krishnaswamy and James Pustejovsky
1114	Eye4Ref: A Multimodal Eye Movement Dataset of Referentially Complex Situations	Özge Alacam, Eugen Ruppert, Amr Rekaby Salama, Tobias Staron and Wolfgang Menzel
1115	Benchmark and Evaluation for Spelling Correction Tools	Hannah Bast and Markus Näther
1116	Identification of Indigenous Knowledge Concepts through Semantic Networks, Spelling Tools and Word Embeddings	Renato Rocha Souza, Amelie Dorn, Barbara Piringer and Eveline Wandl-Vogt
1117	Some Issues with Building a Multilingual Wordnet	Francis Bond, Luis Morgado da Costa, Michael Wayne Goodman, John Philip McCrae and Ahti Lohk
1119	The FISKMÖ Project: Resources and Tools for Finnish-Swedish Machine Translation and Cross-Linguistic Research	Jörg Tiedemann, Tommi Nieminen, Mikko Aulamo, Jenna Kanerva, Akseli Leino, Filip Ginter and Niko Papula
1120	A Multi-word Expression Dataset for Swedish	Murathan Kurfalı, Robert Östling, Johan Sjons and Mats Wirén
1121	Representation of Dictionaries in the Russian Collocations Database	Maria Khokhlova
1122	A Visually-Grounded Parallel Corpus with Phrase-to-Region Linking	Hideki Nakayama, Akihiro Tamura and Takashi Ninomiya
1123	A Broad-coverage Corpus for Finnish Named Entity Recognition	Jouni Luoma, Miika Oinonen, Maria Pyykönen, Veronika Laippala and Sampo Pyysalo
1125	Automated parsing of interlinear glossed text from page images of grammatical descriptions	Erich Round, Mark Ellison, Jayden Macklin-Cordes and Sacha Beniamine
1127	A Joint Approach to Compound Splitting and Idiomatic Compound Detection	Irina Krotova, Sergey Aksenov and ekaterina artemova
1130	The STEM-ECR Dataset: Grounding Scientific Entity References in STEM Scholarly Content to Authoritative Encyclopedic and Lexicographic Sources	Jennifer D'Souza, Anett Hoppe, Arthur Brack, Mohmad Yaser Jaradeh, Sören Auer and Ralph Ewerth
1131	Dedicated Language Resources for Interdisciplinary Research on Multiword Expressions: Best Thing since Sliced Bread	Ferdy Hubers, Catia Cucchiarini and Helmer Strik
1132	Design and Evaluation of SentiEcon: a fine-grained Economic/Financial Sentiment Lexicon from a Corpus of Business News	Antonio Moreno-Ortiz, Javier Fernandez-Cruz and Chantal Pérez Chantal Hernández
1134	A Multi-Orthography Parallel Corpus of Yiddish Nouns	Jonne Saleva
1135	Improving Neural Metaphor Detection with Visual Datasets	Gitit Kehat and James Pustejovsky
1139	On The Performance of Time-Pooling Strategies for End-to-End Spoken Language Identification	Joao Monteiro, Md Jahangir Alam and Tiago Falk
1140	Multilingual Dictionary Based Construction of Core Vocabulary	Winston Wu, Garrett Nicolai and David Yarowsky
1142	Inferring Social Media Users' Mental Health Status from Multimodal Information	Zhentao Xu, Verónica Pérez-Rosas and Rada Mihalcea
1145	Towards Real-time Sign Language Interpreting Robot: Evaluation of Non-manual Components on Recognition Accuracy	medet Mukushev, Vadim Kimmelman and Anara Sandygulova
1146	BrainPredict: a Tool for Predicting and Visualising Local Brain Activity	Youssef Hmamouche, Laurent Prévot, Magalie Ochs and Thierry Chaminade
1147	Building a Hebrew Semantic Role Labeling Lexical Resource from Parallel Movie Subtitles	Ben Eyal and Michael Elhadad
1150	The SAFE-T Corpus: A New Resource for Simulated Public Safety Communications	Dana Delgado, Kevin Walker, Stephanie Strassel, Karen Jones, Christopher Caruso and David Graff
1152	The Johns Hopkins University Bible Corpus: 1600+ Tongues for Typological Exploration	Arya D. McCarthy, Rachel Wicks, Dylan Lewis, Aaron Mueller, Winston Wu, Oliver Adams, Garrett Nicolai, Matt Post and David Yarowsky
1154	Towards Building an Automatic Transcription System for Language Documentation: Experiences from Muyu	Alexander Zahrer, Andrej Zgank and Barbara Schuppler
1155	Synthetic Data for English Lexical Normalization: How Close Can We Get to Manually Annotated Data?	Kelly Dekker and Rob van der Goot
1160	Simplifying Coreference Chains for Dyslexic Children	Rodrigo Wilkens and Amalia Todirascu
1162	Improving NMT Quality Using Terminology Injection	Duane K. Dougal and Deryle Lonsdale
1163	Embeddings for Named Entity Recognition in Geoscience Portuguese Literature	Bernardo Consoli, Joaquim Santos, Diogo Gomes, Fabio Cordeiro, Renata Vieira and Viviane Moreira
1165	PO-EMO: Conceptualization, Annotation, and Modeling of Aesthetic Emotions in German and English Poetry	Thomas Haider, Steffen Eger, Evgeny Kim, Roman Klinger and Winfried Menninghaus
1166	Sentence Level Human Translation Quality Estimation with Attention-based Neural Networks	Yu Yuan and Serge Sharoff
1170	Align then Summarize: Automatic Alignment Methods for Summarization Corpus Creation	Paul Tardy, David Janiszek, Yannick Estève and Vincent Nguyen
1172	MathAlign: Linking Formula Identifiers to their Contextual Natural Language Descriptions	Maria Alexeeva, Rebecca Sharp, Marco A. Valenzuela-Escárcega, Jennifer Kadowaki, Adarsh Pyarelal and Clayton Morrison
1174	Multilingual Twitter Corpus and Baselines for Evaluating Demographic Bias in Hate Speech Recognition	Xiaolei Huang, Linzi Xing, Michael J. Paul and Franck Dernoncourt
1175	Lexical Tone Recognition in Mizo using Acoustic-Prosodic Features	Parismita Gogoi, Abhishek Dey, Wendy Lalhminghlui, Priyankoo Sarmah and S R Mahadeva Prasanna
1176	Towards Flexible Cross-Resource Exploitation of Heterogeneous Language Documentation Data	Daniel Jettka and Timm Lehmberg
1179	Artie Bias Corpus: an Open Dataset for Detecting Demographic Bias in Speech Applications	Josh Meyer, Lindy Rauchenstein, Joshua D. Eisenberg and Nicholas Howell
1181	CantoMap: a Hong Kong Cantonese MapTask Corpus	Grégoire Winterstein, Carmen Tang and Regine Lai
1184	Typical Sentences as a Resource for Valence	Uwe Quasthoff, Lars Hellan, Erik Körner, Thomas Eckart, Dirk Goldhahn and Dorothee Beermann
1187	MTSI-BERT: A Session-aware Knowledge-based Conversational Agent	Matteo Antonio Senese, Giuseppe Rizzo, Mauro Dragoni and Maurizio Morisio
1188	Unit Tests for Multi-Word Expressions and Part-of-Speech Tagging	Robert Krovetz
1189	An Annotated Corpus of Adjective-Adverb Interfaces in Romance Languages	Katharina Gerhalter, Gerlinde Schneider, Christopher Pollin and Martin Hummel
1191	MALT-IT2: A New Resource to Measure Text Difficulty in light of CEFR levels for Italian L2 learning	Luciana Forti, Giuliana Grego Bolli, Filippo Santarelli, Valentino Santucci and Stefania Spina
1193	Predicting Ratings of Real Dialogue Participants from Artificial Data and Ratings of Human Dialogue Observers	Kallirroi Georgila, Carla Gordon, Volodymyr Yanov and David Traum
1194	Methodological Aspects of Developing and Managing an Etymological Lexical Resource: Introducing EtymDB-2.0	Clémentine Fourrier and Benoît Sagot
1195	OFrLex: A Computational Morphological and Syntactical Lexicon for Old French	Gaël Guibon and Benoît Sagot
1196	Evaluating the Neural Machine Translation of Multiword Expressions with Language Resources	Andrea Zaninello and Alexandra Birch
1197	Recognizing Sentence-level Logical Document Structures with the Help of Context-free Grammars	Jonathan Hildebrand, Wahed Hemati and Alexander Mehler
1198	Which Model Should We Use for a Real-World Conversational Dialogue System? a Cross-Language Relevance Model or a Deep Neural Net?	Seyed Hossein Alavi, Anton Leuski and David Traum
1199	Word sense disambiguation for 158 languages using word embeddings only	Varvara Logacheva, Denis Teslenko, Artem Shelmanov, Steffen Remus, Dmitry Ustalov, Andrey Kutuzov, Ekaterina Artemova, Chris Biemann and Alexander Panchenko
1200	Evaluation of Off-the-shelf Speech Recognizers Across Diverse Dialogue Domains	Kallirroi Georgila, Anton Leuski, Volodymyr Yanov and David Traum
1201	Fintan - Flexible, Integrated Transformation and Annotation eNgineering	Christian Fäth, Christian Chiarcos and Björn Ebbrecht
1203	Automatic Reconstruction of Missing Romanian Cognates and Unattested Latin Words	Alina Maria Ciobanu, Liviu P. Dinu and Laurentiu Zoicas
1204	Common Voice: A Massively-Multilingual Speech Corpus	Rosana Ardila, Megan Branson, Kelly Davis, Michael Kohler, Josh Meyer, Michael Henretty, Reuben Morais, Lindsay Saunders, Francis Tyers and Gregor Weber
1207	Word Embedding Evaluation in Downstream Tasks and Semantic Analogies	Joaquim Santos, Bernardo Consoli and Renata Vieira
1208	Adapting BERT to Implicit Discourse Relation Classification with a Focus on Discourse Connectives	Yudai Kishimoto, Yugo Murawaki and Sadao Kurohashi
1209	When Collaborative Treebank Curation Meets Graph Grammars	Gaël Guibon, Marine Courtin, Kim Gerdes and Bruno Guillaume
1210	Chinese Whispers: A Multimodal Dataset for Embodied Language Grounding	Dimosthenis Kontogiorgos, Elena Sibirtseva and Joakim Gustafson
1211	No data to crawl? Monolingual corpus creation from PDF files of four truly low-resource languages in Peru	Gina Bustamante, Arturo Oncevay and Roberto Zariquiey
1212	Massively Multilingual Pronunciation Modeling with WikiPron	Jackson L. Lee, Lucas F.E. Ashby, M. Elizabeth Garza, Yeonju Lee-Sikka, Sean Miller, Alan Wong, Arya D. McCarthy and Kyle Gorman
1215	Related Works in the Linguistic Data Consortium Catalog	Daniel Jaquette, Christopher Cieri and Denise DiPersio
1217	ParlVote: A Corpus for Sentiment Analysis of Political Debates	Gavin Abercrombie and Riza Batista-Navarro
1219	Language Data Sharing in European Public Services – Overcoming Obstacles and Creating Sustainable Data Sharing Infrastructures	Lilli Smal, Andrea Lösch, Josef van Genabith, Maria Giagkou, Thierry Declerck and Stephan Busemann
1220	Multi-lingual Mathematical Word Problem Generation using Long Short Term Memory Networks with Enhanced Input Features	Vijini Liyanage and Surangika Ranathunga
1222	Extraction of Hyponymic Relations in French with Knowledge-Pattern-Based Word Sketches	Antonio San Martín, Catherine Trekker and Pilar León-Araúz
1225	Evaluating Language Tools for Fifteen EU-official Under-resourced Languages	Diego Alves, Gaurish Thakkar and Marko Tadić
1232	Domain Adapted Distant Supervision for Pedagogically Motivated Relation Extraction	Oscar Sainz, Oier Lopez de Lacalle, Itziar Aldabe and Montse Maritxalar
1233	Offensive Language Detection Using Brown Clustering	Zuoyu Tian and Sandra Kübler
1238	ODIL_Syntax: a Free Spontaneous Spoken French Treebank Annotated with Constituent Trees	Ilaine Wang, Aurore Pelletier, Jean-Yves Antoine and Anaïs Halftermeyer
1240	Learning Word Ratings for Empathy and Distress from Document-Level User Responses	Joao Sedoc, Sven Buechel, Yehonathan Nachmany, Anneke Buffone and Lyle Ungar
1241	A Multilingual Evaluation Dataset for Monolingual Word Sense Alignment	Sina Ahmadi, John Philip McCrae, Thierry Declerck, Sanni Nimb, Tanja Wissik, Sussi Olsen, Monica Monachini, Bolette S. Pedersen, Fahad Khan, Simon Krek, Veronika Lipp, Tamas Varadi, Carole Tiberius, Ilan Kernerman, Kira Kovalenko, Oksana Dereza and Theodorus Fransen
1242	Hebrew-Greek-Finnish Parallel Bible with Gold Morpheme Alignment	Anssi Yli-Jyrä, Josi Purhonen, Matti Liljeqvist, Arto Antturi, Pekka Nieminen, Kari-Matti Räntilä and Valtter Luoto
1243	VICTOR: a dataset for Brazilian legal documents classification	Pedro Henrique Luz de Araujo, Teófilo Emídio de Campos, Fabricio Ataides Braz and Nilton Correia da Silva
1246	SeCoDa: Sense Complexity Dataset	David Strohmaier, Sian Gooding, Shiva Taslimipoor and Ekaterina Kochmar
1247	Discovery of Events in the Europarl Languages	Sharid Loáiciga, Christian Hardmeier and Asad Sayeed
1249	Understanding the Dynamics of Second Language Writing through Keystroke Logging and Complexity Contours	Elma Kerz, Fabio Pruneri, Daniel Wiechmann, Yu Qiao and Marcus Ströbel
1251	Word Embedding Evaluation for Sinhala	Dimuthu Lakmal, Surangika Ranathunga, Saman Peramuna and Indu Herath
1252	Dynamic Classification in Web Archiving Collections	Krutarth Patel, Cornelia Caragea and Mark Phillips
1259	Using Crowdsourced Exercises for Vocabulary Training to Expand ConceptNet	Christos Rodosthenous, Verena Lyding, Federico Sangati, Alexander König, Umair ul Hassan, Lionel Nicolas, Jolita Horbacauskiene, Anisia Katinskaia and Lavinia Aparaschivei
1262	FAB: The French Absolute Beginner Corpus for Pronunciation Training	Sean Robertson, Cosmin Munteanu and Gerald Penn
1264	Annotating for Hate Speech: The MaNeCo Corpus and Some Input from Critical Discourse Analysis	Stavros Assimakopoulos, Rebecca Vella Muskat, Lonneke van der Plas and Albert Gatt
1265	A New Resource for German Causal Language	Ines Rehbein and Josef Ruppenhofer
1267	Call My Net 2: A New Resource for Speaker Recognition	Karen Jones, Stephanie Strassel, Kevin Walker and Jonathan Wright
1270	Temporal Histories of Epidemic Events (THEE): a Case Study in Temporal Annotation for Public Health	Jingcheng Niu, Victoria Ng, Gerald Penn and Erin E. Rees
1272	Aspect Flow Representation and Audio Inspired Analysis for Texts	LARISSA VASCONCELOS, Claudio Campelo and Caio Jeronimo
1273	Exploiting Citation Knowledge in Personalised Recommendation of Recent Scientific Publications	Anita Khadka, Iván Cantador and Miriam Fernandez
1274	MULAI: A Multimodal Database of Laughter during Dyadic Interactions	Michel-Pierre Jansen, Khiet P. Truong, Dirk K.J. Heylen and Deniece S. Nazareth
1275	The Connection between the Text and Images of News Articles: New Insights for Multimedia Analysis	Nelleke Oostdijk, Hans van Halteren, Erkan Bașar and Martha Larson
1279	A Broad-Coverage Deep Semantic Lexicon for Verbs	James Allen, Hannah An, Rikwik Bose, Will de Beaumont and Choh Man Teng
1282	Contemplata, a Free Platform for Constituency Treebank Annotation	Jakub Waszczuk, Ilaine Wang, Jean-Yves Antoine and Anaïs Halftermeyer
1286	Computational Etymology and Word Emergence	Winston Wu and David Yarowsky
1287	A Progress Report on Activities at the Linguistic Data Consortium Benefitting the LREC Community	Christopher Cieri, James Fiumara, Stephanie Strassel, Jonathan Wright, Denise DiPersio and Mark Liberman
1289	What Speakers really Mean when they Ask Questions: Classification of Intentions with a Supervised Approach	Iris Eshkol-Taravella and Angèle Barbedette
1291	Modeling Dialogue in Conversational Cognitive Health Screening Interviews	Shahla Farzana, Mina Valizadeh and Natalie Parde
1292	A Platform for Event Extraction in Hindi	Sovan Kumar Sahoo, Saumajit Saha, Asif Ekbal and Pushpak Bhattacharyya
1293	Detection of Reading Absorption in User-Generated Book Reviews: Resources Creation and Evaluation	Piroska Lendvai, Sándor Darányi, Christian Geng, Moniek Kuijpers, Oier Lopez de Lacalle, Jean-Christophe Mensonides, Simone Rebora and Uwe Reichel
1294	Digital Language Infrastructures – Documenting Language Actors	Verena Lyding, Alexander König and Monica Pretti
1296	Annotating and Analyzing Biased Sentences in News Articles using Crowdsourcing	Sora Lim, Adam Jatowt, Michael Färber and Masatoshi Yoshikawa
1297	Automatic Spanish Translation of SQuAD Dataset for Multi-lingual Question Answering	Casimiro Pio Carrino, Marta R. Costa-jussà and José A. R. Fonollosa
1300	Unsupervised Argumentation Mining in Essays	Isaac Persing and Vincent Ng
1301	A Dataset of Translational Equivalents Built on the Basis of plWordNet-Princeton WordNet Synset Mapping	Ewa Rudnicka and Tomasz Naskręt
1302	A Corpus of German Reddit Exchanges (GeRedE)	Andreas Blombach, Natalie Dykes, Philipp Heinrich, Besim Kabashi and Thomas Proisl
1303	Creating a Parallel Icelandic Dependency Treebank from Raw Text to Universal Dependencies	Hildur Jónsdóttir and Anton Karl Ingason
1307	Kvistur: a BiLSTM Compound Splitter for Icelandic	Jón Daðason, David Mollberg and Hrafn Loftsson
1308	Morphological Segmentation for Low Resource Languages	Justin Mott, Ann Bies, Stephanie Strassel, Jordan Kodner, Caitlin Richter, Hongzhi Xu and Mitchell Marcus
1310	ArzEn: A Speech Corpus for Code-switched Egyptian Arabic-English	Injy Hamed, Ngoc Thang Vu and Slim Abdennadher
1312	Defying Wikidata: Validation of Terminological Relations in the Web of Data	Patricia Martín-Chozas, Sina Ahmadi and Elena Montiel-Ponsoda
1313	Stress Test Evaluation of Transformer-based Models in Natural Language Understanding Tasks	Carlos Aspillaga, Andrés Carvallo and Vladimir Araujo
1315	The Database of the Russian Sign Language TheRuSLan	Ildar Kagirov, Denis Ivanko, Dmitry Ryumin, Alexander Axyonov and Alexey Karpov
1316	AccentDB: A Database of Non-Native English Accents for Improved Neural Speech Recognition	Afroz Ahamad, Ankit Anand and Pranesh Bhargava
1318	Design of BCCWJ-EEG: Balanced Corpus with Human Electroencephalography	Yohei Oseki and Masayuki Asahara
1319	Towards the Necessity for Debiasing Natural Language Inference Datasets	Mithun Paul Panenghat, Sandeep Suntwal, Faiz Rafique, Rebecca Sharp and Mihai Surdeanu
1321	Evaluation of Deep Gaussian Processes for Text Classification	P. Jayashree and P. K. Srijith
1322	Recent Developments for the Linguistic Linked Open Data Infrastructure	Thierry Declerck, John Philip McCrae, Christian Chiarcos, Philipp Cimiano, Jorge Gracia, Matthias Hartung, Deirdre Lee, Elena Montiel-Ponsoda, Artem Revenko and Roser Saurí
1323	Building a Universal Dependencies Treebank for Occitan	Aleksandra Miletic, Myriam Bras, Marianne Vergez-Couret, Louise Esher, Clamença Poujade and Jean Sibille
1326	Opinion Target Extraction via Sentiment Propagation	Gerardo Ocampo Diaz, Xuanming ZHANG and Vincent Ng
1327	Spatial AMR: Expanded Spatial Annotation in the Context of a Grounded Minecraft Corpus	Julia Bonn, Martha Palmer, Zheng Cai and Kristin Wright-Bettner
1329	Rad-SpatialNet: A Frame-based Resource for Fine-Grained Spatial Relations in Radiology Reports	Surabhi Datta, Morgan Ulinski, Jordan Godfrey-Stovall, Shekhar Khanpara, Roy F. Riascos-Castaneda and Kirk Roberts
1332	CEASR: A Corpus for Evaluating Automatic Speech Recognition	Malgorzata Anna Ulasik, Manuela Hürlimann, Fabian Germann, Esin Gedik, Fernando Benites and Mark Cieliebak
1334	One Classifier for All Ambiguous Words: Overcoming Data Sparsity by Utilizing Sense Correlations Across Words	Prafulla Kumar Choubey and Ruihong Huang
1338	A Corpus of Adpositional Supersenses for Mandarin Chinese	Siyao Peng, Yang Liu, Yilun Zhu, Austin Blodgett, Yushi Zhao and Nathan Schneider
1340	DoRe: A French Corpus of 240M Tokens from Corporate Annual Reports	Corentin MASSON and Patrick Paroubek
1344	The Language of Brain Signals: Natural Language Processing of Electroencephalography Reports	Ramon Maldonado and Sanda Harabagiu
1345	Language Resources for Historical Newspapers: the Impresso Collection	Maud Ehrmann, Matteo Romanello, Simon Clematide, Phillip Benjamin Ströbel and Raphaël Barman
1347	Towards the Conversion of National Corpus of Polish to Universal Dependencies	Alina Wróblewska
1349	Allgemeine Musikalische Zeitung as a Searchable Online Corpus	Bernd Kampe, Tinghui Duan and Udo Hahn
1350	DaCToR: A Data Collection Tool for the RELATER Project	Juan Hussain, Oussama Zenkri, Sebastian Stüker and Alex Waibel
1351	AMUSED: A Multi-Stream Vector Representation Method for Use in Natural Dialogue	Gaurav Kumar, Rishabh Joshi, Jaspreet Singh and Promod Yenigalla
1352	LifeQA: A Real-life Dataset for Video Question Answering	Santiago Castro, Mahmoud Azab, Jonathan Stroud, Cristina Noujaim, Ruoyao Wang, Jia Deng and Rada Mihalcea
1357	Development and Evaluation of Speech Synthesis Corpora for Latvian	Roberts Darģis and Peteris Paikens
1358	Toward a Paradigm Shift in Collection of Learner Corpora	Anisia Katinskaia, Sardana Ivanova and Roman Yangarber
1359	Interchange Formats for Visualization: LIF and MMIF	Kyeongmin Rim, Kelley Lynch, Marc Verhagen, Nancy Ide and James Pustejovsky
1362	A Corpus for Visual Question Answering Annotated with Frame Semantic Information	Mehrdad Alizadeh and Barbara Di Eugenio
1372	Building the Old Javanese Wordnet	David Moeljadi and Zakariya Pamuji Aminullah
1374	Large Name Transliteration Resource	Fernando Benites, Gilbert François Duivesteijn, Pius von Däniken and Mark Cieliebak
1377	CPLM, a Parallel Corpus for Mexican Languages: Development and Interface	Gerardo Sierra Martínez, Cynthia Montaño, Gemma Bel-Enguix, Diego Córdova and Margarita Mota Montoya
1379	Neural disambiguation of lemma and part of speech in morphologically rich languages	José María Hoya Quecedo, Koppatz Maximilian and Roman Yangarber
1380	Samrómur: Crowd-sourcing Data Collection for Icelandic Speech Recognition	David Erik Mollberg, Ólafur Helgi Jónsson, Sunneva Þorsteinsdóttir, Steinþór Steingrímsson, Eydís Huld Magnúsdóttir and Jon Gudnason
1382	An Annotation Approach for Social and Referential Gaze in Dialogue	Vidya Somashekarappa, Christine Howes and Asad Sayeed
1385	Non-Linearity in mapping based Cross-Lingual Word Embeddings	Jiawei Zhao and Andrew Gilman
1386	Marking Irony Activators in a Universal Dependencies Treebank: The Case of an Italian Twitter Corpus	Alessandra Teresa Cignarella, Manuela Sanguinetti, Cristina Bosco and Paolo Rosso
1387	English WordNet Random Walk Pseudo-Corpora	Filip Klubička, Alfredo Maldonado, Abhijit Mahalunkar and John Kelleher
1388	Cross-lingual Named Entity List Search via Transliteration	Aleksandr Khakhmovich, Svetlana Pavlova, Kira Kirillova, Nikolay Arefyev and Ekaterina Savilova
1389	French Tweet Corpus for Automatic Stance Detection	Marc Evrard, Rémi Uro, Nicolas Hervé and Béatrice Mazoyer
1390	Evaluation of Dataset Selection for Pre-Training and Fine-Tuning Transformer Language Models for Clinical Question Answering	Sarvesh Soni and Kirk Roberts
1392	Creating an Annotated Corpus for Aspect-based Sentiment Analysis in Swedish	Jacobo Rouces, Lars Borin and Nina Tahmasebi
1394	Quality Focused Approach to a Learner Corpus Development	Roberts Darģis, Ilze Auziņa, Kristīne Levāne-Petrova and Inga Kaija
1395	HAHA 2019 Dataset: A Corpus for Humor Analysis in Spanish	Luis Chiruzzo, Santiago Castro and Aiala Rosá
1398	Establishing a New State-of-the-Art for French Named Entity Recognition	Pedro Javier Ortiz Suárez, Yoann Dupont, Benjamin Muller, Laurent Romary and Benoît Sagot
1401	Brand-Product Relation Extraction Using Heterogeneous Vector SpaceRepresentations	Arkadiusz Janz, Łukasz Kopociński, Maciej Piasecki and Agnieszka Pluwak
1407	Computing with Subjectivity Lexicons	Caio L. M. Jeronimo, Claudio E. C. Campelo, Leandro Balby Marinho, Allan Sales, Adriano Veloso and Roberta Viola
1408	Using the RUPEX Multichannel Corpus in a Pilot fMRI Study on Speech Disfluencies	Katerina Smirnova, Nikolay Korotaev, Yana Panikratova, Irina Lebedeva, Ekaterina Pechenkova and Olga Fedorova
1413	An Exploratory Study into Automated Precis Grading	Orphee De Clercq and Senne Van Hoecke
1416	Improving Stigmatised Language Detection in Health-Care Discussions on Social Media with Deep Learning	Nadiya Straton and Hyeju Jang
1417	Annotation interoperability in the post-ISOcat era	Christian Chiarcos, Maxim Ionov and Christian Fäth
1423	Next Step for Aranea: Gentle Touch of Universal Dependencies	Vladimír Benko
1426	A French Corpus for Semantic Similarity	Rémi Cardon and Natalia Grabar
1427	Developing NLP Tools with a New Corpus of Learner Spanish	Sam Davidson, Aaron Yamada, Paloma Fernandez Mira, Agustina Carando, Claudia H. Sanchez Gutierrez and Kenji Sagae
1428	A Tale of Three Parsers: Towards Diagnostic Evaluation for Meaning Representation Parsing	Maja Buljan, Joakim Nivre, Stephan Oepen and Lilja Øvrelid
1429	A Summarization Dataset of Slovak News Articles	Marek Suppa and Jergus Adamec
1432	Enhanced Large Scale Colloquial Persian Language Understanding	Hadi Abdi Khojasteh, Ebrahim Ansari and Mahdi Bohlouli
1433	Building OCR/NER Test Collections	Dawn Lawrie, James Mayfield and David Etter
1434	Developing Dataset of Japanese Slot Filling Quizzes Designed for Evaluation of Machine Reading Comprehension	Takuto Watarai, Yasutaka Yokoi and Masatoshi Tsuchiya
1435	Reconstructing NER Corpora: a Case Study on Bulgarian	Iva Marinova, Laska Laskova, Petya Osenova, Kiril Simov and Alexander Popov
1436	On the Formal Standardization of Terminology Resources: The Case Study of TriMED	Federica Vezzani and Giorgio Maria Di Nunzio
1438	DaNewsroom: A Large-scale Danish Summarisation Dataset	Daniel Varab and Natalie Schluter
1440	Predicting Item Survival for Multiple Choice Questions in a High-Stakes Medical Exam	Victoria Yaneva, Le An Ha, Peter Baldwin and Janet Mee
1444	SiNER: A Large Dataset for Sindhi Named Entity Recognition	Wazir Ali, Junyu Lu and Zenglin Xu
1445	An Annotated Dataset of Discourse Modes in Hindi Stories	Swapnil Dhanwal, Hritwik Dutta, Hitesh Nankani, Nilay Shrivastava, Yaman Kumar, Junyi Jessy Li, Debanjan Mahata, Rakesh Gosangi, Haimin Zhang, Rajiv Shah and Amanda Stent
1446	Detecting Multiword Expression Type Helps Lexical Complexity Assessment	Ekaterina Kochmar, Sian Gooding and Matthew Shardlow
1453	The Russian PropBank	Sarah Moeller, Irina Wagner, Martha Palmer, Kathryn Conger and Skatje Myers
1457	Modeling Factual Claims with Semantic Frames	Fatma Arslan, Josue Caraballo, Damian Jimenez and Chengkai Li
1459	DeepNLPF: A Framework for Integrating Third Party NLP Tools	Francisco Rodrigues, Rinaldo Lima, William Domingues, Robson Fidalgo, Adrian Chifu, Bernard Espinasse and Sébastien Fournier
1460	Stylometry in a Bilingual Setup	Silvie Cinkova and Jan Rybicki
1462	Offensive Language Identification in Greek	Zesis Pitenis, Marcos Zampieri and Tharindu Ranasinghe
1464	The ACoLi Dictionary Graph	Christian Chiarcos, Christian Fäth and Maxim Ionov
1467	MuDoCo: Corpus for Multidomain Coreference Resolution and Referring Expression Generation	Scott Martin, Shivani Poddar and Kartikeya Upasani
1477	Dialect Clustering with Character-Based Metrics: in search of the boundary of language and dialect	Yo Sato and Kevin Heffernan

Important dates

Latest Tweets