Twitter成为Johns Hopkins研究人员的流感追踪工具
关于流感的普通推文可能只是科学研究的一部分。约翰霍普金斯大学的计算机科学家正在使用Twitter跟踪的流感病例数。研究人员开发了一种使用机器学习实时跟踪流感病例并将推文归类为关于流感的简单聊天或实际感染报告的方法。
约翰·霍普金斯大学计算机科学系的博士候选人,迈克尔·保罗说:“我们的系统得知,'在家中感冒'这样的短语表示真正的感染,而'对感冒的厌倦'是无关紧要的。”研究小组在电子邮件中告诉eWEEK。
保罗说,对推文进行分类的机器学习方法比搜索所有提及“流感”的推文更接近政府流感数据。
我们要把对流感的大肆宣传与真正生病的人的信息分开,”计算机科学系助理研究员,约翰霍普金斯大学人类语言技术卓越中心的研究科学家Mark Dredze博士说:在学校新闻网站HUB上的帖子中。
约翰霍普金斯大学的计算机算法使用人类语言处理技术创建有关推文的统计信息。约翰·霍普金斯大学发言人菲尔·斯奈德曼(Phil Sneiderman)写道,通过Twitter,该学校的方法产生的实时结果比疾病控制与预防中心的结果更快。
保罗说:“我们建立了一个依靠数十台计算机来处理我们收集的TB级数据的系统,该系统能够对推文进行自动分类,并每天估计流感的流行率。”
Sneiderman说,疾病预防控制中心记录医院就诊时与流感相关的症状的过程需要两个星期来报告数据。
一个CDC地图截至1月19日的一周中几乎每一个各州表现出广泛的流感活动。
Dredze说:“ 12月下旬,新闻媒体注意到了流感的流行,导致我们的Twitter系统产生的假率有所上升。” “但是我们的新算法比其他系统处理这种效果要好得多,而忽略了推文中的虚假峰值。”
约翰·霍普金斯报道说,研究人员每分钟分析5,000条公共推文,每天下载800万条推文进行分析。
急诊医学系社会,行为和健康科学高级模型中心医学院的博士后大卫·布罗纳托夫斯基(David Broniatowski)表示,关于科比·布莱恩特(Kobe Bryant)流感样症状的Twitter讨论不符合实际的流感病例。
布罗尼亚托夫斯基对HUB说:“ Twitter流感活动的近期激增是由于在最近一场比赛中对篮球传奇人物科比·布莱恩特的流感样症状的讨论引起的。” “尽管科比先生的健康状况良好,但这种推文对帮助公共卫生官员为下一次大爆发做好准备的作用很小。”
研究人员制作的地图显示,去年的流感季节与2012-2013年冬季的流感季节之间存在明显差异。约翰霍普金斯大学计划与政府卫生机构共享其Twitter流感追踪方法。
学校报告说,在将数据输入其Twitter流感分析系统之前,已删除了用户名和性别信息。
保罗说,通过分析推文,研究人员能够洞悉人们在患流感时如何自我服药。保罗指出,卫生官员可能会利用这些数据来了解人们如何错误地使用抗生素来治疗流感。
德雷兹在推特制作的视频中说:“公共卫生的重要部分实际上是弄清您的人口,推特开辟了一种全新的方式来查看该人群并了解正在发生的事情。” “这确实可以改变我们在这个的公共卫生方式以及我们如何从人口中获得反馈。”