Political Twitter Discourse Corpus (PTDC)

The Political Twitter Discourse Corpus (PTDC) has been created for use as a discourse reference corpus tool in the focused analysis of political discourse occurring on Twitter - particularly for comparative keyword analyses. It is comprised of the most recent original tweets (i.e. not inclusive of retweets, up to a maximum of 3000 per user) of all serving US state governors, members of congress and senators. The PTDC consists of 205,303 individual tweets and 4,659,381 words.


談話指示の言語資料ツールとして、政治的談話コーパス (PTDC) “を開発し、ツイッター上で展開される政治的ツイートの分析、とりわけ、キーワードを用いた比較分析に用いている。PTDC は最新のツイートの原文(リツイートは含まず、ユーザー1人につき最高3000ツイート)で構成され、その全てはアメリカの州知事、国会議員、議会議員によるものである。PTDC 205,303ツイート、4,659,381語を収録している。