加入收藏 | 设为首页 | 会员中心 | 我要投稿 我爱制作网_潮州站长网 (http://www.0768zz.com/)- 物联安全、建站、操作系统、云计算、数据迁移!
当前位置: 首页 > 运营中心 > 交互 > 正文

直男福音:AI能帮你侦察女朋友的情绪了!

发布时间:2021-06-14 15:13:37 所属栏目:交互 来源:互联网
导读:根据世界卫生组织(WHO)的数据,抑郁症是全球最常见的疾病之一,每年影响逾3亿人的生活,以及导致近80万人自杀。诊断抑郁症是一项具有挑战性、复杂的工作。梅奥诊所介绍,抑郁症的症状各不相同,医生可以使用身体检查、实验室测试、精神病学评估问卷和美国精
根据世界卫生组织(WHO)的数据,抑郁症是全球最常见的疾病之一,每年影响逾3亿人的生活,以及导致近80万人自杀。诊断抑郁症是一项具有挑战性、复杂的工作。梅奥诊所介绍,抑郁症的症状各不相同,医生可以使用身体检查、实验室测试、精神病学评估问卷和美国精神病学协会DSM-5(精神疾病诊断与统计手册)的标准来确定抑郁症的诊断。对于心理健康专家来说,提出正确的问题,并准确对患者的回答做出判断,是诊断的关键。但是,如果诊断可以通过自然的对话来完成,而无需通过专门的询问呢?

由麻省理工学院(MIT)计算科学和人工智能实验室成员阿尔哈奈(Tuka Alhanai)、格拉斯(James Glass),以及医学工程与科学研究所成员加赛米(Mohammad Ghassemi)组成的创新研究团队研究了一种方法,让AI能够在自然对话中识别抑郁患者。

该团队开发了一种基于神经网络的人工智能模型,可以通过识别音频和采访文本的语音模式来预测抑郁症。他们共使用了142个病人访谈记录的数据,用以建立抑郁症检测的模型序列。之后在无上下文建模、加权建模和序列建模3种模式中进行了测试。

首先,研究小组要评估“在访谈中思考和主体无关的独立问题时”,基于音频和文本特性的预测准确性——换句话说就是“上下文无关”的建模。研究小组将279个音频和100个文本特征输入到一个L1正则化的逻辑回归模型中。对于文本特性,团队利用Python Gensim库的Doc2Vec实现了“总共8050个训练示例、272418个单词和7411的语言树量”。对于音频特性,该团队“提取了响应每个主题的553个初始特性。”

在第2项实验中,研究小组的目标是研究其在面对“和访谈无关的系列问题”时的预测能力。为了实现这一目标,他们创建了一个类似于上下文无关模型的加权模型,并设置了一个关的区别——它根据“在训练集中出现问题的预测能力”为模型分配权重。

在第三个实验中,研究小组将重点放在“按访谈时间的变化建模”上,并使用了双向长短时记忆(LSTM)神经网络,因为它“具有对序列数据建模的额外优势”。

有趣的是,研究人员发现,当使用音频预测抑郁症时,模型所需的数据是文本的4倍多。该模型平均需要30个音频序列完成预测,相比之下,文本问答序列只需7个。研究小组发现,序列建模能更准确地预测抑郁,而文本和音频的多模态模型表现最好。讽刺的是,AI神经网络模型的本质混淆了它从输入数据中发现的模式。人工智能的不透明是由于神经网络固有的复杂性和大量的参数。无论如何,麻省理工学院的这项研究代表了创新的一步,它将创造出一种新的潜在工具,帮助医生和心理健康专家在未来解决诊断抑郁症的复杂性。

无独有偶,除了学术圈,业界巨头也正针对日常生活领域研发相应技术。亚马逊已经申请了一项新额技术专利,使其智能音箱Alexa能够通过用户发出指令的音高和音量,识别用户的情绪,并根据用户的“感觉”做出反应。正如专利中描述的那样,Alexa可能会识别出“快乐、快乐、愤怒、悲伤、悲伤、恐惧、厌恶、厌倦、(或)压力”,并对相应的命令做出回应,可能是“具有高度针对性的音频内容,比如音频广告或促销”。

当然,从专利到产品还有一段路要走,但它们可以让人了解公司对新兴技术的看法和反应。在这一案例中,专利暗示了亚马逊在其在线产品系列中动态投放定向广告的可能性。他们在专利中举了个例子:如果你告诉Alexa你饿了,她就能从你流口水的声音判断出你想吃什么东西。紧接着,她会问你想要的菜谱,或者问一个“与特定广告商有关的”问题。

定向广告传统上依赖于人类行为的大数据:化妆品广告投放给女性、烤肉夹投放给男性、痤疮药物投放给年轻人、心脏药物投放给老年人。从那以后,算法分析大致就在这个范围内发挥作用,顶多扩大一些——根据多类数据,广告商可以设置多重条件,比如25岁以下的单亲妈妈,或者40岁以上的西海岸民主党人。

(编辑:我爱制作网_潮州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读