Political Twitter Discourse Corpus (PTDC)

The Political Twitter Discourse Corpus (PTDC) has been created for use as a discourse reference corpus tool in the focused analysis of political discourse occurring on Twitter - particularly for comparative keyword analyses. It is comprised of the most recent original tweets (i.e. not inclusive of retweets, up to a maximum of 3000 per user) of all serving US state governors, members of congress and senators as at October, 2017. The PTDC consists of 205,303 individual tweets and 4,659,381 words.


談話指示の言語資料ツールとして、政治的談話コーパス (PTDC) “を開発し、ツイッター上で展開される政治的ツイートの分析、とりわけ、キーワードを用いた比較分析に用いている。PTDC は最新のツイートの原文(リツイートは含まず、ユーザー1人につき最高3000ツイート)で構成され、その全てはアメリカの州知事、国会議員、議会議員によるものである。PTDC 205,303ツイート、4,659,381語を収録している。