直男福音：AI能帮你侦察女朋友的情绪了！

发布时间：2021-06-14 15:13:37 所属栏目：交互来源：互联网

导读：根据世界卫生组织(WHO)的数据，抑郁症是全球最常见的疾病之一，每年影响逾3亿人的生活，以及导致近80万人自杀。诊断抑郁症是一项具有挑战性、复杂的工作。梅奥诊所介绍，抑郁症的症状各不相同，医生可以使用身体检查、实验室测试、精神病学评估问卷和美国精

根据世界卫生组织(WHO)的数据，抑郁症是全球最常见的疾病之一，每年影响逾3亿人的生活，以及导致近80万人自杀。诊断抑郁症是一项具有挑战性、复杂的工作。梅奥诊所介绍，抑郁症的症状各不相同，医生可以使用身体检查、实验室测试、精神病学评估问卷和美国精神病学协会DSM-5(精神疾病诊断与统计手册)的标准来确定抑郁症的诊断。对于心理健康专家来说，提出正确的问题，并准确对患者的回答做出判断，是诊断的关键。但是，如果诊断可以通过自然的对话来完成，而无需通过专门的询问呢?

由麻省理工学院(MIT)计算科学和人工智能实验室成员阿尔哈奈(Tuka Alhanai)、格拉斯(James Glass)，以及医学工程与科学研究所成员加赛米(Mohammad Ghassemi)组成的创新研究团队研究了一种方法，让AI能够在自然对话中识别抑郁患者。

该团队开发了一种基于神经网络的人工智能模型，可以通过识别音频和采访文本的语音模式来预测抑郁症。他们共使用了142个病人访谈记录的数据，用以建立抑郁症检测的模型序列。之后在无上下文建模、加权建模和序列建模3种模式中进行了测试。

首先，研究小组要评估“在访谈中思考和主体无关的独立问题时”，基于音频和文本特性的预测准确性——换句话说就是“上下文无关”的建模。研究小组将279个音频和100个文本特征输入到一个L1正则化的逻辑回归模型中。对于文本特性，团队利用Python Gensim库的Doc2Vec实现了“总共8050个训练示例、272418个单词和7411的语言树量”。对于音频特性，该团队“提取了响应每个主题的553个初始特性。”

在第2项实验中，研究小组的目标是研究其在面对“和访谈无关的系列问题”时的预测能力。为了实现这一目标，他们创建了一个类似于上下文无关模型的加权模型，并设置了一个关的区别——它根据“在训练集中出现问题的预测能力”为模型分配权重。

在第三个实验中，研究小组将重点放在“按访谈时间的变化建模”上，并使用了双向长短时记忆(LSTM)神经网络，因为它“具有对序列数据建模的额外优势”。

有趣的是，研究人员发现，当使用音频预测抑郁症时，模型所需的数据是文本的4倍多。该模型平均需要30个音频序列完成预测，相比之下，文本问答序列只需7个。研究小组发现，序列建模能更准确地预测抑郁，而文本和音频的多模态模型表现最好。讽刺的是，AI神经网络模型的本质混淆了它从输入数据中发现的模式。人工智能的不透明是由于神经网络固有的复杂性和大量的参数。无论如何，麻省理工学院的这项研究代表了创新的一步，它将创造出一种新的潜在工具，帮助医生和心理健康专家在未来解决诊断抑郁症的复杂性。

无独有偶，除了学术圈，业界巨头也正针对日常生活领域研发相应技术。亚马逊已经申请了一项新额技术专利，使其智能音箱Alexa能够通过用户发出指令的音高和音量，识别用户的情绪，并根据用户的“感觉”做出反应。正如专利中描述的那样，Alexa可能会识别出“快乐、快乐、愤怒、悲伤、悲伤、恐惧、厌恶、厌倦、(或)压力”，并对相应的命令做出回应，可能是“具有高度针对性的音频内容，比如音频广告或促销”。

当然，从专利到产品还有一段路要走，但它们可以让人了解公司对新兴技术的看法和反应。在这一案例中，专利暗示了亚马逊在其在线产品系列中动态投放定向广告的可能性。他们在专利中举了个例子：如果你告诉Alexa你饿了，她就能从你流口水的声音判断出你想吃什么东西。紧接着，她会问你想要的菜谱，或者问一个“与特定广告商有关的”问题。

定向广告传统上依赖于人类行为的大数据：化妆品广告投放给女性、烤肉夹投放给男性、痤疮药物投放给年轻人、心脏药物投放给老年人。从那以后，算法分析大致就在这个范围内发挥作用，顶多扩大一些——根据多类数据，广告商可以设置多重条件，比如25岁以下的单亲妈妈，或者40岁以上的西海岸民主党人。

（编辑：我爱制作网_潮州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!