电脑 & 信息科学

大学生虚假信息检测的研究体会 & 分析

这个REU网站项目将吸引积极的学生在虚假信息检测和分析的快速增长的研究领域. 专注于识别虚假信息, 这个项目将开阔学生们的视野, 让他们全面深入地了解虚假信息及其在网络上的病毒式传播. 他们将利用所学的知识和技能来辨别和揭穿虚假信息, 这能帮助他们的家人吗, 朋友, 以及社交媒体联系,最终有助于防止虚假信息的传播. 他们的知识和技能不仅将为学生在研究或行业中从事与虚假信息相关的工作做好准备, 这将鼓励他们继续研究生学习和研究. 这一项目也将有助于多元化的发展, 通过为经济多元化的学生群体提供研究和教育机会,具有全球竞争力的劳动力, 包括女, 未被充分代表的少数民族, 第一代大学生, 以及那些来自本科院校的学生,他们之前可能没有研究或研究生院的经历.

参与REU网站项目的学生将学习:(1)虚假信息的概念, 它的类型, 例子, 活跃的研究课题, (2)检测社交媒体虚假信息的主流计算方法, 包括如何访问, 清洁, 进行预处理, 可视化数据以及如何使用开源编程工具构建分析和预测模型, (3)评价研究成果的重要指标, 比较基线模型, 并产生初步的成果,为出版高质量的研究产品, (4)基本的研究技能,包括头脑风暴讨论, 编程实验, 取证, 试错法, 技术写作, 以及研究报告. 学生将在教师现有的广泛的虚假信息研究项目中进行自己选择的主题的实践研究. 这个REU网站的目标是让参与的学生参与从数据分析的角度研究虚假信息的现实世界项目, 信息检索, 应用机器学习, web存档, 还有社会计算. 参与者将学习基本的知识和技能,以支持未来的职业生涯, 无论是研究型还是应用型. 该项目由“安全与可信网络空间”(SaTC)项目和“网络部队/服务奖学金”(SFS)项目共同提供资金,以表彰该项目与这两个项目的目标相一致.


 

搜索“REU网站:大学生虚假信息检测与分析研究经验”,点击“立即申请”按钮. 您可能需要创建一个帐户来申请REU计划.

关于

  • 6000美元的津贴

  • 600元交通费津贴

  • 住房 & 提供膳食(校内)

  • 实地考察和客座讲座

  • 是一名即将升入本科课程的二年级、三年级或四年级学生. 所有学术专业和学科都会被考虑, 但会优先考虑心理学专业的学生, 工程, 或相关领域

  • 是美国公民或永久居民

  • 首选GPA 3.00或更高

  • 必须提交简历吗, 求职信(个人陈述), 成绩单, 写作样本, 至少一份推荐信和申请表一起提交

  • 与导师进行为期10周的全职研究

  • 参加每周的讲座/研讨会和实地考察

  • 在夏季结束时制作一份海报展示

  • 6000美元的津贴

  • 600元交通费津贴

  • 住房 & 提供膳食(校内)

  • 实地考察和客座讲座

  • 是一名即将升入本科课程的二年级、三年级或四年级学生. 所有学术专业和学科都会被考虑, 但会优先考虑心理学专业的学生, 工程, 或相关领域

  • 是美国公民或永久居民

  • 首选GPA 3.00或更高

  • 必须提交简历吗, 求职信(个人陈述), 成绩单, 写作样本, 至少一份推荐信和申请表一起提交

  • 与导师进行为期10周的全职研究

  • 参加每周的讲座/研讨会和实地考察

  • 在夏季结束时制作一份海报展示

项目

博士导师:. 纳尔逊

社交媒体的屏幕截图(屏幕截图)是一种在社交媒体上分享引用和署名的流行方式. 使用屏幕截图的原因有很多:在不提高用户粘性(印象)的情况下突出某人的帖子, 转发, 点击, 等.), 促进跨平台共享 , 或者分享一个有被编辑或删除风险的帖子. 不幸的是, 只分享一个帖子的图片, 尤其是从另一个平台, 这是散布虚假信息的机会吗. 例如, 图1显示了两个带有屏幕截图的脸谱网帖子:一个是真实的Instagram帖子,显示两个潜在的飓风正向新奥尔良袭来, 另一条是一条假推文(转发了100万次),说我有多喜欢屏幕截图(我真的不喜欢).

这符合我们称之为Web存档取证的新兴领域, 其中包括在多存档环境中建立真实性(剧透:区块链没有帮助). 特别是,我们使用网络档案和社交媒体来确定公众人物实际说过的话的概率.g.(乔伊·安·里德的博客),并没有说(e.g.他是犹他爵士队的球迷),或者说了之后又删掉了(e.g.,显示已删除的推文和已删除但尚未存档的网页的方法)

学生的研究目标将包括创建、评估和分享(例如).g.(通过GitHub)

  • 社交媒体屏幕截图的真实和不真实例子的黄金标准数据集,
  • 用于检测和提取结构元数据的方法和工具,以及
  • 提供屏幕截图是真是假的概率的方法和工具.

学生学习成果:

Students will learn: social media APIs; web crawling and page scraping; web archive APIs, including Memento and CDX; and image processing, 包括OCRing和分割.

博士导师:. Ashok

与网页内容交互, 盲人用户依赖屏幕阅读器, 一种特殊用途的辅助技术,叙述网页的内容,并通过键盘快捷键实现内容导航. 因此,与视力正常的用户不同,盲人用户不能依赖视觉线索.g.、彩色、虚假广告形象、虚假视频等.)识别网上的欺骗性内容,例如广告、恶意链接、产品演示等. 因此, 盲人用户更容易受到网络诈骗和攻击, 因为他们更有可能浏览到不可信的网站, 下载并安装恶意软件. 目前, 没有可访问性解决方案可以检测并提醒盲人用户注意网页中的欺骗性内容.

在这个项目中, 学生将开发新的交互式系统,利用基于人工智能(AI)的解决方案,帮助盲人用户识别和规避欺骗性内容. 对这个, 学生将首先进行上下文调查,深入了解盲人用户对不同类型的欺骗性内容的敏感性, 以及缺乏替代视觉线索与这些内容交互的影响. 然后,学生们将建立机器学习模型来自动识别欺骗性内容. 具体地说, 学生将扩展先前的语义网页分析工作, 还包括自动欺骗段提取. 最后, 学生将设计, 开发和评估可用的非视觉用户界面,利用这些算法帮助盲人屏幕阅读器用户避免欺骗性内容.

学生学习成果:

学生将了解网页无障碍的重要性, 以及如何利用现代人工智能技术来满足视障人士的无障碍需求, 特别是关于网络安全. 他们将接受如何构建网页注释数据集的培训, 使用包括深度神经网络在内的监督机器学习模型进行实验, 设计和开发非可视化的可用界面, 设计并进行用户研究以进行评估, 最后, 分析和解释用户数据.

博士导师:. Frydenlund

模因是在人与人之间传播和进化的文化产物. 这些词可以代表任何东西,从广告歌、时尚到话题标签和图片. 政治表情包有时被视为一种抗议艺术. 这些带有简单文字或标签的图片表达了对不同政治观点的蔑视,可以在多个社交媒体平台上疯传, 但也助长了虚假信息. 这些数字, 转瞬即逝的文化文物不仅有助于现代政治话语, 它们塑造了个人和集体的行动, 从抗议运动到暴力.

世界面临着前所未有的难民潮和日益两极分化的政治气候, 关于难民和难民政策的政治模因对人权具有真正的影响. 很少有人研究病毒模因是如何, 支持和反对难民, 影响难民应对和政策. 我们之前使用twitter和手机数据的研究表明,网络情绪与现实世界中针对土耳其叙利亚难民的暴力行为有关 .

学生将开发一种衡量难民相关模因的影响力和政治倾向的方法, 他们必须根据对项目的理解创造性地确定其定义

学生学习成果:

学生将学习挖掘社交媒体数据, 进行情绪分析, 并将这些计算技能与网站登录文章的定性分析结合起来, 政治演讲, 以及政策文件,试图理解模因如何影响现实世界的政治. 学生们将识别与同一个国家有关的亲难民和反难民表情包, 政治辩论, 和/或事件. 他们会调查, 采用多种数字化和定性方法, 以确定准确性, 影响, 政治倾向, 以及与模因相关的政治行动/抗议的现实含义.

博士导师:. Perrotti

从研究到实践的过程对于理论的发展至关重要, 告知治疗方案, 确定公共卫生解决方案. 互联网, 数字技术, 社交媒体极大地改变了同行评议的经验数据的共享方式, 宣传, 和利用. 向公众传播健康和科学信息的方式发生了变化,产生了消极和积极的结果.

重要科学成果的即时性和可用性可以通过支持和改善医患关系来增强和吸引特定患者群体. 然而, 社交媒体平台带来了假网站登录的广泛传播和迅速影响,其程度超过了可验证的网站登录,给帮助行业带来了独特的挑战. 这些挑战包括澄清有关疾病暴发和疫苗安全的虚假谣言,应对对医疗的毫无根据的怀疑,并解决患者对推荐的管理方案的不准确. 我们迫切需要研究社交媒体平台对帮助专业的科学实践的影响,因为它与发生频率有关, 暴露的方式和流行程度, 确认偏误的作用, 以及对个人结果的影响.

学生学习成果:

学生将制定医疗虚假信息在数字平台上传播的措施,并使用计算机化分析来量化对大学生决策的影响. 学生将识别与健康有关的信息的信息传递和传递(例如.e.(关于医疗、心理或身体健康)在各种社交媒体平台上. 学生将学习评估和定义跨专业主题和术语, 在各种社交平台上应用数据提取方法, 并分析定量和定性数据的主题和重大成果.

博士导师:. Jayarathna

随着网络平台上虚假信息的日益传播, 在与科学文章的互动过程中,迫切需要调查人类判断的因素(文章的真实性). 例如, 研究表明,眼动追踪技术可以识别与学习过程相关的各种方面.g. 困惑的时刻,无聊的时刻,快乐的时刻),以及认知的各个方面. 在我们之前的工作中, 我们专注于从阅读科学论文的新手读者的眼球运动中获得洞察力,使用多种眼球追踪措施. 我们扩展了这项工作,研究了在阅读任务中使用眼动追踪技术缩放和平移阅读材料的眼动追踪措施.

这个项目的主要目标是通过眼动固定和停留时间来分析数字文档的无约束阅读模式. 我们将专注于限制屏幕内容与科学论文内容之间的假阳性关键点匹配. 这在评估不受约束的阅读模式时特别有用,这种模式的特征不太明显,比如图像, 图表, 和表.

本研究项目的目的是使用眼动追踪技术来记录阅读任务期间的眼动活动, 研究参与者的阅读模式, 调查特征集,以确定客观测量来评估虚假科学文章的参与度.

学生学习成果:

学生将使用眼动追踪技术开发实验设计,以调查个人如何评估信息的可信度, 他们如何评估一个信息源是否可信, 以及他们如何识别和应对虚假信息. 学生将学习如何处理来自眼动仪的原始眼球注视数据流到我们的眼球运动分析管道,以生成传统的位置注视和复杂的瞳孔测量.

博士导师:. Wu

如今,人们使用笔记本电脑或移动设备进行许多日常活动. 通过脸谱网、Instagram和twitter阅读网站登录占据了屏幕上的大部分时间. 统计数据显示,62%的美国人.S. 2016年,成年人通过社交媒体接触网站登录,而2012年这一比例仅为49%. 然而, 公共数字媒体经常会将事实信息与虚假科学网站登录混在一起, 哪一点通常很难确定, 特别是对于非专业人士. Nature网站登录上的一篇文章就是一个例子.网站的标题是“现在不要看”, 但自2012年以来,北极海冰总量增长了近40%。”, 哪篇文章试图对全球变暖的科学真实性提出质疑. 原网站登录存档于 http://archive.is/rd294. 这些科学网站登录文章制造了幻觉, 误解并最终影响公众舆论,甚至在更广泛的范围内造成严重后果, 社会的规模. 许多同行评议的论文已经发表, 提供证据反驳上述假网站登录中的观点和理由. 大多数事实核查服务,如snopes网站.com,通过费力的、完全手动的网页浏览和交叉验证程序来追踪来源. 现有旨在自动验证网站登录文章可信度的解决方案仍不能令人满意.

在这个项目中, 学生将研究计算方法,从大量科学出版物中自动发现科学虚假信息的证据. 目标是找到一个有效的模型来推荐最相关的科学文章,帮助读者更好地评估科学网站登录的可信度, 找到最相关的声明. 这项工作将通过研究新的机器学习和信息检索模型来增强我们提出的现有方法, 旨在提高准确性,缩小从文档到段落的相关性粒度级别. 学生将有机会从数据汇编中执行一个全栈项目, 模型训练, 评价, 撰写报告, 和演示.

学生学习成果:

学生将学习如何将现实世界的问题转化为基本的机器学习问题. 他们将接受培训,学习如何从其他数据发布中收集和预处理科学网站登录数据,并应用最先进的模型和神经搜索引擎来促进虚假科学网站登录的检测.

博士导师:. Wu

如今,人们使用笔记本电脑或移动设备进行许多日常活动. 通过脸谱网、Instagram和twitter阅读网站登录占据了屏幕上的大部分时间. 统计数据显示,62%的美国人.S. 2016年,成年人通过社交媒体接触网站登录,而2012年这一比例仅为49%. 然而, 公共数字媒体经常会将事实信息与虚假科学网站登录混在一起, 哪一点通常很难确定, 特别是对于非专业人士. Nature网站登录上的一篇文章就是一个例子.网站的标题是“现在不要看”, 但自2012年以来,北极海冰总量增长了近40%。”, 哪篇文章试图对全球变暖的科学真实性提出质疑. 原网站登录存档于 http://archive.is/rd294. 这些科学网站登录文章制造了幻觉, 误解并最终影响公众舆论,甚至在更广泛的范围内造成严重后果, 社会的规模. 许多同行评议的论文已经发表, 提供证据反驳上述假网站登录中的观点和理由. 大多数事实核查服务,如 snopes网站.com,通过费力的、完全手动的网页浏览和交叉验证程序来追踪来源. 现有旨在自动验证网站登录文章可信度的解决方案仍不能令人满意.

学生将调查Instagram上的虚假信息活动,并开发使用网络档案访问和分析Instagram账户和帖子的历史元数据的方法. 向用户提供这些元数据将帮助他们成为社交媒体上共享信息的更有洞察力的消费者. 我们现在有一个研究生,他已经开始 调查Instagram页面在公共网络档案中的覆盖情况. 这个项目的学生将扩展这项工作, 重点打击散布虚假信息的账号和帖子.

该项目的目标是开发收集和向Instagram用户提供有关潜在虚假信息来源的重要元数据的方法. 所开发的技术也可以应用于其他社交媒体平台,为REU网站的其他项目提供支持.

学生学习成果:

学生将获得社交媒体的技术和社会学方面的经验, 包括如何将Instagram页面传递给浏览器, 如何挖掘web档案的历史元数据, 以及那些散布虚假信息的人的技术. 学生将获得Python的直接实践知识, R, 如何使用Web api, 以及如何从他们收集的数据中开发有效的可视化.

博士导师:. Poursardar

网络平台在我们的日常生活中扮演着重要的角色. 在你在亚马逊上购买商品之前, 你看产品的评级, 阅读评论,注意人们对产品的评价. 当你想出去吃饭的时候, 在你决定去哪家餐馆之前,你会先看一下那家餐馆的评论. 当你想看一部电影时,你会看电影的评论. 当你想选择你的新医生时,你会在网上阅读关于他/她的评论. 当你想在手机上下载一个新的应用程序时, 您查看特定应用程序的评级. 正如你在这些例子中看到的,用户评论非常重要,因为它们会影响我们的决策. 虚假或误导的评论会降低人们对在线平台的信任.

众包网站利用互联网雇佣并让远程人员执行按需任务. 企业通常发布被称为人类智能任务(hit)的职位。, 比如调查, 识别图像或视频中的特定内容, 撰写产品描述, 回答问题, 为产品写一篇(好的)评论来推销它, 为YouTube上的视频点赞/投票. 被称为众工的工人浏览现有的工作, 完成它们并获得雇主设定的费率. 这项工作的性质有助于众包工作者远程工作并获得报酬. 最后两个众包工作的例子——为产品或服务提供评论和为视频投票——可能被用来在在线平台上制造虚假信息和/或欺诈性评论.

例如,下图显示了快速的工人上的两个欺诈性职位描述的例子.

检测欺诈性评论和来自众包结果的评论作者至关重要,应该被视为保护在线社区的一种方式.

学生学习成果:

  • 在这个项目中, 学生将学习如何从亚马逊等在线平台提取和分析数据和文本, 快速的工人, 和/或亚马逊土耳其机器人.
  • 在这个项目中, 学生将学习:网络爬行, 从亚马逊等在线平台抓取页面并提取文本, 快速的工人, 和/或亚马逊土耳其机器人; analyze extracted data; identify user behavior patterns.

研究导师

助理教授 计算机科学
助理教授 计算机科学
教授、首席科学家、副署长 & 杰出的学者 学术事务
研究副教授 学术事务
研究助理教授 建模、分析 & 模拟中心

常见问题的

申请人将根据学术成绩进行评估, 研究/工作经验, 对计算机科学的研究领域或可能的职业感兴趣. 申请有几个步骤:

  1. 通读可用的项目(位于“项目”选项卡中),并确定您最感兴趣的项目.
  2. 在ETAP申请系统中填写申请表.
  3. 收集你的证明文件. 您需要上传以下所有文件才能被考虑参加该计划:
    • 简历或简历
    • 求职信(最多一页),详细说明你对计算机科学的兴趣, 相关的研究经历和职业或学术目标
    • 你上过的所有大学的非正式成绩单(项目录取时需要正式成绩单)
    • 一封推荐信
    • 写作样本(必须是独立完成的,不是小组项目的一部分).

是的! 具有计算机科学背景的申请人优先考虑, 数据科学, 信息科学或其他阀杆领域, 但我们鼓励所有对计算机科学有浓厚兴趣的专业人士申请(包括尚未宣布专业的学生)。.

是的! 我们鼓励所有背景的对计算机科学有浓厚兴趣的学生申请. 除了, 我们强烈鼓励目前在阀杆领域未被充分代表的群体(女性)申请, 少数民族, 以及残疾人士).

REU项目为期10周. 这是一个全日制课程. 你将与一位教师导师一起完成一个项目. 每周会有一次活动,重点关注你的专业或学术发展. 这可能包括来自计算机科学领域的客座讲师, 关于如何申请研究生课程的研讨会, 或者去相关的研究中心实地考察.

bet8体育娱乐入口(ODU)位于弗吉尼亚州诺福克. ODU是该地区最大的大学,拥有100多个学术课程和24,000名学生. 校园占地355英亩,有很多餐饮选择,甚至还有自己的艺术博物馆! 诺福克, VA是一个充满活力的城市,有几个文化区,距离海滩只有几分钟的路程! 如果被录取,你将有机会在ODU生活. 不做研究的时候, 您将能够充分利用ODU和大诺福克地区所提供的一切.