广告

变语音质量下的说话人识别与空间化(研究三)

章节
  • 21.下载
的一部分电信服务中的T-Labs系列书系列(TLABS)

抽象的

本章介绍了关于在声学上更复杂的听力测试场景中的行为谈话者识别的第三个试验研究,涉及两个讲话者之间的“转弯”。根据非空间和空间语音再现模式期间的谈话者位置提示的可用性,参与者基于不同感知和认知过程的响应策略。在低语音传播质量的条件下,由于展示或失控语音线索的屏蔽或失真,更高的感知 - 认知负荷(与主观的谈话者识别工作),通过动员信息处理资源来包括[主观评级的初步分析在主要实验期间收集的数据在Uhrig等人中描述,测试了基于扬声器的空间语音再现的经验(QoE)模型的体验。:2020多媒体经验质量(QOMEX)的第十二届国际会议。IEEE,Athlone,2020,P 1-6。]

关键字

谈话者识别 谈话者本地化 语音传输质量 空间化 演讲中繁殖 喇叭 说话的时间 声源本地化 语音识别 反应时间模式 感知暗示 言语感知 空间关注 选择性注意 语音清晰度 谈话者识别努力 声音相似 连续评定量表 响应时间切换成本 感官认知负荷

参考

  1. 1。
    ITU-T推荐P.800,传输质量的主观测定方法(国际电信联盟,日内瓦,1996年)谷歌学术
  2. 2。
    J.Blauert,空间听证:人类声音定位的心理物理学启版。(麻省理工学院出版社,剑桥,1997)谷歌学术
  3. 3.
    D. Brungart,M. Ericson,B. SIMPSON,用于提高多人类演讲显示的有效性的设计考虑因素2002年听觉显示国际会议的诉讼程序,日本京都,2002年,第1-7页谷歌学术
  4. 4。
    中华民国运气,与事件相关的潜在技术介绍,第二版。(麻省理工学院出版社,剑桥,2014)谷歌学术
  5. 5。
    S. Uhrig,G.Mitgag,S.Möller,J.-N。voigt-antons,p300表示超出语音变化的语音质量的上下文相关的变化。J.神经仪。16.(6),066008(2019)谷歌学术
  6. 6。
    S. Uhrig,A. Perkis,D.M.Behne,语音传输质量对皮质听觉引起潜力指示的感觉处理的影响。J.神经仪。17.(4),046021(2020)谷歌学术
  7. 7。
    R.W. Proctor,T. Van Zandt,简单和复杂系统的人类因素,第3 edn。(CRC Press,Boca Raton,2018)谷歌学术
  8. 8。
    S. Uhrig,S.Möller,下午Behne,U.P.Svensson,A. Perkis,测试基于扬声器的空间语音再现的经验质量(QoE)模型,2020第十二届多媒体经验质量国际会议(QOMEX)(IEEE, Athlone, 2020),第1-6页谷歌学术
  9. 9。
    G. Lin,S. Carlile,在随后的会话轮转中切换听觉空间的成本。前面。>。9,124(2015)十字架谷歌学术
  10. 10。
    G. Lin,S. Carlile,在会话转向过程中切换非空间注意的影响。SCI。代表。9(1),8057(2019)谷歌学术
  11. 11.
    V.最佳,J.B. Ahlstrom,C.R. Mason,E. Roverud,T.K.Perrachione,G. Kidd,J.R. Dubno,Talker识别:掩蔽,听力损失和年龄的影响。j . Acoust。Soc。点。143.(2), 1085 - 1092 (2018)十字架谷歌学术
  12. 12.
    M. Latinus,P.Belin,人类语音感知。Curr。BIOL。21.(4)、R143-R145 (2011)十字架谷歌学术
  13. 13。
    B.C.J.摩尔,听证会心理的介绍,第6 edn。(Brill,Leiden,2013)谷歌学术
  14. 14。
    R. Drullman,A.W.Bronkhorst,多通道语音可懂度和谈话者认可,使用单声道,双耳和三维听觉介绍。j . Acoust。Soc。点。107.(4),2224-2235(2000)十字架谷歌学术
  15. 15。
    k .布卢姆G.-J。空间音频技术在电话语音识别中的应用Proc。IWSSIP 2010-17第7届系统,信号和图像处理国际会议(RIO DE JNEIRO,2010)谷歌学术
  16. 16。
    信息和能量掩蔽效应在两个同时说话者知觉中的作用。j . Acoust。Soc。点。109.(3),1101-1109(2001)十字架谷歌学术
  17. 17。
    D.S.Brungart,B.D.SIMPSON,M.A. ERICSON,K.R.斯科特,信息和精力充沛的掩蔽效果在多个同步讲话者的看法中。j . Acoust。Soc。点。110.(5), 2527 - 2538 (2001)十字架谷歌学术
  18. 18。
    M.J. Traxler,M.A.Gernsbacher(EDS。),精神语言学手册,第二版。(elestvier,波士顿,2006)谷歌学术
  19. 19。
    F.Köster,F.Schiffner,D.Guse,J.Ahrens,J.Skowronek,S.Möller,朝着Matlab工具箱,用于在P.TCA Schema之后强加语音信号障碍,音响工程学会年会,卷。139(2015)谷歌学术
  20. 20。
    M.Wältermann,A. Rake,S.Möller,窄带和宽带语音传输的质量方面。Acta常规。常规。96.(6), 1090 - 1103 (2010)十字架谷歌学术
  21. 21。
    ITU-T建议书56,主动言语水平的客观测量(国际电信联盟(ITU),日内瓦,2011年)谷歌学术
  22. 22。
    A. Leman,J.Fure,E. Parizet,背景噪声信息内容对VoIP应用的语音质量评估的影响。j . Acoust。Soc。点。123.(5),3066-3066(2008)十字架谷歌学术
  23. 23。
    l·费尔南德斯盖拉多对电信渠道的人类和自动演讲者认可,爵士。T-Labs系列电信服务(施普林格,新加坡,2016)beplay登入谷歌学术
  24. 24。
    S.Möller,质量工程:QualitätKommunikationStechnischerSysteme(beplay登入Springer,Heidelberg,2010)十字架谷歌学术
  25. 25。
    ITU-T建议书851,基于语音对话系统的电话业务质量主观评价(国际电信联盟(ITU),日内瓦,2003)谷歌学术
  26. 26。
    F. Köster, D. Guse, M. Wältermann, S. Möller,用于传输语音质量评价的离散ACR量表和扩展连续量表的比较,在Fortschritte der Akustik - Daga 2015:Plenarvortr。你。Fachbeitr。天。41. DTSCH。jahrestg。F。傲慢。(Dega,Berlin,2015),PP。150-153谷歌学术
  27. 27。
    M.Wältermann,基于维度的传输语音质量建模,爵士。T-Labs系列在电信服务(Springer,Heidelberg,2013)beplay登入谷歌学术
  28. 28。
    A.拉克,VoIP语音质量的评估与预测(威利,奇切斯特,2006)十字架谷歌学术
  29. 29。
    A. Rake,C.Schlegel,K. Hoeldtke,M.Geier,J.Ahrens,听力和会话质量的空间音频会议,音频工程协会会议:40国际会议:空间音频:感觉空间的声音(2010)谷歌学术
  30. 30.
    J. Skowronek,A. Rake,调查对话者数量对多方音频会议的经验质量的影响第12届国际演讲协会年会(Interspeech)(ISCA,2011),PP。829-832谷歌学术
  31. 31。
    J. Skowronek, A. Raake,空间和非空间音频会议电话的认知负荷、语音沟通质量和体验质量评估。Commun演讲。66.,154-175(2015)十字架谷歌学术
  32. 32。
    G. KIDD,T.L.Arbogast,C.R. Mason,F.J. Gallun,知道在哪里听的优势。j . Acoust。Soc。点。118.(6),3804-3815(2005)十字架谷歌学术
  33. 33。
    L.FernándezGallardo,S.Möller,M.Wagner,人类扬声器识别通过窄带和宽带通信系统传输的已知声音的人类扬声器识别的比较10学报》上。资讯科技署演讲沟通研讨会(2012),页1 - 4谷歌学术
  34. 34。
    L.FernándezGallardo,S.Möller,M.Wagner,人类扬声器识别通过不同用户界面和传输通道传输的已知声音的识别2013 IEEE音响,语音和信号处理国际会议(IEEE,温哥华,2013),第7775-7779页谷歌学术
  35. 35。
    N. Schuck, R. Gaschler, D. Wenke, J. Heinzle, P. french, J. D.。海恩斯,C.反响,内侧前额叶皮层预测内部驱动的策略转变。神经元86.(1), 331 - 340 (2015)十字架谷歌学术
  36. 36。
    作者:R. Gaschler, N.W. Schuck, C. Reverberi, P.A. Frensch, D. Wenke,附带的共变学习导致策略改变。《公共科学图书馆•综合》14.(1) e0210597 (2019)谷歌学术
  37. 37。
    A.A.Zekveld,M. Rudner,S.E.Kramer,J.Lyzenga,J.Ryzenga,J.Rönnberg,通过降低语音相似性,通过增加目标和掩蔽器语音之间的空间分离来减少聆听过程中的认知处理负荷。前面。神经科学8,88(2014)十字架谷歌学术
  38. 38。
    T. Koelewijn,H. de Kluiver,B.G.Shinn-Cunningham,A.A.Zekveld,S.E.克莱默,瞳孔反应显示难以焦虑的注意力增加。听证会。323.81 - 90 (2015)十字架谷歌学术
  39. 39。
    E. Donchin,A.F. Kramer,C.D.有趣的,事件相关的大脑潜力对工程心理学问题的应用,心理生理学:系统,流程和应用程序,ed。由M.G.H.科尔斯,E. Donchin,S.W.Porges,第3 Edn。(Guilford Press,纽约,1986),第702-718页谷歌学术
  40. 40.
    jr西蒙,点小,处理听觉信息:来自不相关线索的干扰。j:。Psychol。53.(5),433-435(1969)十字架谷歌学术
  41. 41.
    J.R. Simon,对刺激源的反应。J. Exp。Psychol。81.(1),174-176(1969年)十字架谷歌学术
  42. 42。
    C.-h.Lu,R.W.Proctor,无关的位置信息有关性能的影响:综述西蒙和空间速率效应。心灵。公牛。录2(2), 174 - 207 (1995)十字架谷歌学术
  43. 43。
    作为。布法曼,听觉场景分析:声音的知觉组织(MIT Press,Cambridge,1990)十字架谷歌学术
  44. 44。
    关键词:语音识别,能量掩蔽,空间释放,信息掩蔽j . Acoust。Soc。点。123.(6), 4369 - 4379 (2008)十字架谷歌学术
  45. 45。
    B.G.Shinn-Cunningham,基于对象的听觉和视觉关注。趋势Cogn。SCI。12.(5), 182 - 186 (2008)十字架谷歌学术
  46. 46。
    A. Ihlefeld,B. Shinn-Cunningham,解开空间线索对听觉对象的选择和形成的影响。j . Acoust。Soc。点。124.(4), 2224 - 2235 (2008)十字架谷歌学术
  47. 47。
    V.最好,E.J.ozmeral,N.Kopčo,B.G.Shinn-Cunningham,物体连续性增强了选择性听觉的关注。Proc。NAT。阿卡。SCI。105.(35),13174-13178(2008)十字架谷歌学术
  48. 48。
    V.最好,B.G.Shinn-Cunningham,E.J.ozmeral,N.Kopčo,探讨听觉空间连续性的好处。j . Acoust。Soc。点。127.(6)、EL258-EL264 (2010)十字架谷歌学术
  49. 49。
    I. Koch,V. Lawo,J. Fels,M.Vorländer,在鸡尾酒会中切换:探索故意控制听觉选择性的关注。J. Exp。Psychol。哼。感知。履行。37.(4),1140-1147(2011)十字架谷歌学术
  50. 50.
    关键词:二元听觉,有意识的注意转换,非空间性,空间选择Q. J.心理Exp。67.(10),2010-2024(2014)十字架谷歌学术
  51. 51.
    J. Oberem,V. Lawo,I. Koch,J. Fels,故意切换听觉选择性注意:探索在一个AneChice室中的不同双耳再现方法。Acta常规。常规。100.(6),1139-1148(2014)十字架谷歌学术
  52. 52.
    J. Rönnberg, T. Lunner, A. Zekveld, P. Sörqvist, H. Danielsson, B. Lyxell, o. Dahlström, C. sigonret, S. Stenfelt, M. K. Pichora-Fuller, M. Rudner,语言理解(ELU)模型:理论,经验和临床进展。前面。系统。>。731 (2013)谷歌学术
  53. 53.
    N. Rönnberg, M. Rudner, T. Lunner, S. Stenfelt,通过测量噪音中语言的短期记忆存储和处理来评估听力努力。朗的演讲。听到的。17.(3), 123 - 132 (2014)十字架谷歌学术
  54. 54。
    是。Johnsrude,J.M. Rodd,在听听演讲时提高处理需求的因素,语言神经生物学(Elsevier, Amsterdam, 2016),第491-502页谷歌学术
  55. 55。
    d·卡尼曼关注和努力(Prentice-Hall,Englewood Cliffs,1973)谷歌学术
  56. 56。
    a。f。桑德斯,研究压力和人类表现的模型。Acta Psychol。53.(1),61-97(1983)十字架谷歌学术
  57. 57。
    G.R.J.曲棍球,压力和高工作量下人力绩效调控的补偿控制:一种认知积极的框架。BIOL。Psychol。45.(1 - 3), 73 - 93 (1997)十字架谷歌学术
  58. 58。
    A. Zuanazzi,U. Noppeney,添加剂和互动影响的空间关注和对感知决策的期望。SCI。代表。8(1),6732(2018)谷歌学术
  59. 59。
    空间注意和期望的不同神经机制在多感觉世界中引导感知推理。j . >。39.(12), 2301 - 2312 (2019)十字架谷歌学术
  60. 60.
    K. Allen, S. Carlile, D. Alais,讲话者特征和空间位置对听觉流的贡献。j . Acoust。Soc。点。123.(3),1562-1570(2008)十字架谷歌学术
  61. 61.
    R.S. Bolia, W.T. Nelson, R.M. Morley,鸡尾酒会效应中的不对称表现:对空间音频显示器设计的启示。人类的事实。j .的嗡嗡声。的事实。尔刚。Soc。43.(2),208-216(2001)十字架谷歌学术
  62. 62.
    在电信中通过虚拟听觉显示的音频增强现实,在第16届国际听觉显示会议(ICAD-2010)华盛顿,2010年,第63-71页谷歌学术
  63. 63.
    W.A. YOST,R.H. DYE,S. SHOMET,一个模拟的“鸡尾酒派对”,最多三个声源。感知。心理学家。58.(7), 1026 - 1036 (1996)十字架谷歌学术
  64. 64.
    M.A. Ericson,D.S.Brungart,B.D.SIMPSON,影响多人类演讲显示中的可懂度的因素。int。J. Aviat。Psychol。14.(3),313-334(2004)十字架谷歌学术

版权信息

©作者,在施普林格Nature Switzerland AG 2022独家许可下beplay登入

作者和联系

  1. 1。质量和可用性实验室TechnischeUniversität柏林柏林德国

个性化的建议