0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心
发布
  • 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

AIGC时代的多模态知识工程思考与展望

深度学习自然语言处理 来源:知识工场 2023-04-14 10:24 次阅读

内容简介:ChatGPT的火爆出圈使得AI生成(AIGC)技术受到了全社会前所未有的广泛关注。此消彼长之下,传统的知识工程遭受了诸多质疑。在多模态智能领域,AIGC的能力不断提升,多模态知识工程工作应该何去何从?是否仍有价值?在本次分享中,讲者将探讨当前AIGC技术耀眼“光芒”背后的“暗面”,思考与展望AIGC时代的多模态知识工程研究。

关于AIGC时代的多模态知识工程思考与展望,我们将从以下六个方面展开介绍:

第一部分,我们回顾一下AIGC技术的发展历程和它带来的划时代影响力;

第二部分,我们对AIGC技术的不足(阿克琉斯之踵)之处进行分析与总结;

第三部分,我们将介绍多模态认知智能的框架和两种实现路径,并进行对比分析;

第四~六部分,我们会展望当前AIGC大模型和MMKG多模态图谱间如何竞与合。

01

AIGC时代:未来已来

d1dd9862-d9b9-11ed-bfe3-dac502259ad0.png

随着人工智能总体阶段的发展,生成式人工智能技术(AIGC)也在不断迭代。从20世纪50年代到90年代中期,是AIGC的早期萌芽阶段,这一时期受限于技术水平,AIGC仅限于小范围实验。这一时期的AIGC典型事件包括:1950年,艾伦·图灵提出的著名的“图灵测试”,给出判断机器是否具有“智能”的方法;1966年,世界上第一款可人机对话机器人“Eliza”的问世;以及在80年代中期IBM公司创造的语音控制打字机“Tangora”的出现。

而从20世纪90年代到21世纪10年代中期,AIGC处于沉淀积累阶段,这一阶段的AIGC技术从实验性向实用性转变,但仍因受限于算法瓶颈,无法直接进行内容生成。这一阶段的AIGC典型事件则包括2007年世界上第一部完全由人工智能创作的小说《1 the road》的问世;以及2012年微软开发的全自动同声传译系统的出现,它能够将英文语音自动翻译成中文语音。

自21世纪10年代中期至今,是AIGC快速发展的阶段,得益于深度学习算法不断迭代,人工智能生成内容百花齐放。2014年,Goodfellow提出的生成对抗网络GAN用于生成图像;2019年,英伟达发布StyleGAN模型可以自动生成高质量图片;2019年DeepMind发布DVD-GAN用于生成连续性视频,直到2022年,OpenAI发布ChatGPT模型生成流畅的自然语言文本。

可以说,ChatGPT的爆红出圈宣告了AIGC时代的到来。

d1ee876c-d9b9-11ed-bfe3-dac502259ad0.png

现在的AIGC技术可以生成的内容包括文本、图像、音频和视频等。如今,已经有很多强大的算法被发明出来,如用于图像生成的Stable Diffusion算法。此外,还有很多走在技术前沿的创业公司不断推动AIGC技术的应用落地,如Jasper AI的AI写作软件和midjourney的AI绘画工具的发明都在解放着人类的内容创作生产力。这些共同促进了一个万物皆可AI生成的AIGC时代。

右图是一张来自互联网的趣味图片——机器人一家三口在人类博物馆中观赏人类的最后一篇推文“GPT-5也没啥了不起的”——表达了创作者对当今AIGC技术飞速发展的隐隐担忧。

d1f8083c-d9b9-11ed-bfe3-dac502259ad0.png

那么,我们首先看一下多模态大模型的分类与发展脉络。如上图所示,多模态大模型发展非常迅速,我们可以将多模态大模型简单分为多模态统一大模型和多模态文图生成大模型,前者用于统一的多模态生成和理解,后者特指具备强大的多模态文到图生成能力的大模型。

d20094ca-d9b9-11ed-bfe3-dac502259ad0.png

当前,文图生成大模型已经可以生成逼真、高清以及风格化的意境图像。

d20ca076-d9b9-11ed-bfe3-dac502259ad0.png

还有一些文图生成大模型,如斯坦福大学提出的ControlNet,其生成能力更加精致、可控。它不仅可以生成各类质地细腻、细节精致的图片,也可以通过简笔画来对图像生成进行操控。

d216de06-d9b9-11ed-bfe3-dac502259ad0.png

AIGC大模型生成的视频在某种程度上也可谓自然流畅、栩栩如生。

d2212636-d9b9-11ed-bfe3-dac502259ad0.png

我们还看到Google发布的PaLM-E模型,展现了多模态AIGC大模型驱动的具身智能的情景。这个具备5620亿参数的具身多模态大模型,可以将真实世界的传感器信号与文本输入相结合,建立语言和感知的链接,可以用自然语言操控机器人完成操作规划、视觉问答等任务。

d22bbdda-d9b9-11ed-bfe3-dac502259ad0.png

AIGC的惊艳效果不禁让很多人对符号主义(知识工程)的研究产生了疑问。Rich Sutton在著名文章《苦涩的教训》中提出,唯一导致AI进步的因素是更多的数据和更有效的计算。而DeepMind的研究主任Nando de Freitas也宣称,“AI现在完全取决于规模,AI领域更难的挑战已经解决了,游戏结束了!”。我们也看到,在大多数领域,大模型已经(暂时)战胜了精心设计的知识工程。然而,AI的流派之争真的结束了吗?

02

AIGC的阿克琉斯之踵

第二部分,让我们来看一下当前AIGC大模型实际存在的一些问题。

d23b02b8-d9b9-11ed-bfe3-dac502259ad0.png

尽管今天的ChatGPT(包括GPT-4)很强大,它的诸多问题仍旧难以忽视:

第一、强语言弱知识的问题,ChatGPT无法理解用户查询中的知识性错误,它具备强大的语言能力,但知识能力仍旧较弱;

第二、实时信息自更新慢,新旧知识难以区分,目前ChatGPT的知识还停留在2021年,而每一次信息更新都需要成本高昂的重新训练;

第三、其逻辑推理能力并不可靠,应该说尚不具备复杂数学逻辑推理与专业逻辑推理能力;

第四、由于缺乏领域知识,它也无法真正为领域类问题提供专业靠谱的答案。

d243380c-d9b9-11ed-bfe3-dac502259ad0.png

当前的多模态大模型的跨模态生成能力也尚不完善。上图是我们用文图生成大模型Stable Diffusion生成的一些案例。具体来说,当前的文图生成存在组合泛化、属性泄露、方位理解混乱、语义理解错误等问题。因此,尽管我们看到AIGC跨模态生成的视觉效果惊艳,但往往存在较大的模态间信息不对称问题。

d24b9d80-d9b9-11ed-bfe3-dac502259ad0.png

此外,当前多模态大模型的多模态理解能力也存在问题。上图是来自BLIP2进行视觉问答任务的错误样例。我们看到:

1)模型由于缺乏事实知识,无法知晓球拍上的“w”图案是品牌“Wilson”的logo,因而错误回答成“nike”;

2)模型由于欠缺逻辑推理能力,不理解图像场景和问题的逻辑关系,因而回答错误;

3)模型由于常识储备不足,对某个具体场景(冲浪)下的意图理解犯了常识性错误。

d25614ea-d9b9-11ed-bfe3-dac502259ad0.png

让我们再来看一下Google的具身多模态大模型PaLM-E,虽然依赖如此大规模的参数实现了初步的机器人操控,但其demo视频中所展示的空间范围、物品种类、规划和操作任务的复杂度等都非常有限。我们可以想象,如果要在真实世界的复杂场景中达到实用级别,PaLM-E的参数规模是否还需要增大百倍、千倍甚至万倍?如果一味用海量参数存储所有知识,那么智慧涌现的代价是否过于昂贵?

d2734ede-d9b9-11ed-bfe3-dac502259ad0.png

至此,我们对多模态大模型做个简单的小结。首先,多模态大模型的本质是“用语言解释视觉,用视觉完善语言”。换句话说,我们要将文本中的语言符号知识,与视觉中的可视化信息建立统计关联。所谓“用语言解释视觉”,就是将语言中蕴含的符号知识体系和逻辑推理能力延伸至对视觉内容的理解;而所谓“用视觉完善语言”,是指丰富的视觉信息可以成为符号知识体系和逻辑推理能力的重要完善和补充。

我们知道,多模态大模型能发挥重大作用的重要前提是:

1)具有海量高质量图文配对数据;

2)文字富含事实知识和常识;

3)其逻辑推理过程可显式化被学习。

而我们所面临的现实情况却是:

1)数据量大但质量差,信息不对称;

2)纯文字中的知识与常识也不完备;

3)其逻辑推理是隐性难以学习的。

正因为这些理想与现实间的差距,导致了前面提到的多模态大模型的种种问题与不足。综上,我们认为,统计大模型始终难以较低成本,全面、准确地掌握人类知识、常识和逻辑推理能力。

03

多模态认知智能

第三部分,我们引出多模态认知智能,其研究旨在解决前一部分提到的问题。

d27df2da-d9b9-11ed-bfe3-dac502259ad0.png

上图是我们提出的一个多模态认知智能的研究框架。总的来说,多模态认知智能主要研究基于多模态数据的知识获取、表示、推理与应用。在多模态知识获取层面,我们从语料中通过抽取、生成、群智等方法获取知识或者从语言模型中萃取知识。在多模态知识表示层面,可以使用多模态图谱、常识图谱、语言模型、大规模知识网络等方法进行知识表示。基于多模态知识表示,可以进一步支撑多模态理解、推理和元认知等能力,从而赋能诸如跨模态搜索、推荐、问答、生成等多模态知识的应用。

d2858676-d9b9-11ed-bfe3-dac502259ad0.png

多模态认知智能目前有两种实现路径。一种是多模态大模型,其代表了联结主义和经验主义的思想,从海量预训练数据中学习概率关联,是简单而鲁棒的,它属于统计学习范畴,具备端到端、干预少和“数”尽其用的优势,其劣势在于难以学习到从因到果、从主到次、从整体到部分、从概括到具体、从现象到本质、从具体到一般等逻辑关系。

另一种实现路径是多模态知识工程,其代表了符号主义的思想,从精选数据和专家知识中学习符号关联,是精细而脆弱的,它往往通过专家系统和知识图谱实现,具备易推理、可控、可干预、可解释的优点,但是它的劣势主要在于将数据转换成符号知识的过程往往伴随着巨大的信息损失,而其中隐性知识等难以表达的知识往往是信息损失的主体。

结合多模态大模型和多模态知识工程的优劣势分析,我们认为:在AIGC大模型时代,多模态知识工程依然不可或缺。

d293fa08-d9b9-11ed-bfe3-dac502259ad0.png

当前,多模态知识工程的主要形式之一是多模态知识图谱(MMKG)。多模态知识图谱是在传统知识图谱的基础上,增加多种模态数据以丰富符号知识表达的方法,其多模态数据包括但不限于图像、视频、语言、代码等。多模态知识图谱可以将符号接地到具象的视觉等模态对象上,实现跨模态语义对齐。

d2a5aea6-d9b9-11ed-bfe3-dac502259ad0.png

目前多模知识图谱的主流形式有两种。

一种是A-MMKG,其中多模态数据仅作为文字符号实体的关联属性存在;

另一种是N-MMKG,其中多模态数据也可作为图谱中的实体存在,可与现有实体发生广泛关联。

d2b19b58-d9b9-11ed-bfe3-dac502259ad0.png

至此,我们进一步分析AIGC多模态大模型和大规模多模态知识图谱各自的优缺点。

多模态大模型的优点是:

1)关联推理能力强:可以学习掌握大量跨模态知识模式,隐空间的关联推理能力强,具有很强的泛化能力;

2)多任务通吃:一套大模型处理各类跨模态任务;

3)人工成本低:不依赖人工schema设计与数据标注;

4)适配能力强:可通过调优训练或prompt对话等方式来适配新的领域和任务。

而其不足之处在于:

1)可靠程度低:所生成的内容可靠性堪忧,存在误差累积、隐私泄露等问题,无法胜任高精度严肃场景需求;

2)知识推理弱:没有真正掌握数据背后的知识,缺乏知识推理能力,更无因果推理能力;

3)可解释性弱:虽有CoT加持,但可解释性仍然不足;

4)训练成本高:需要消耗大量计算资源和时间来进行训练,需要强大的计算设备和高效的算法。

而与之对应的,多模态知识图谱的优点是:

1)专业可信度高:其结构和关系清晰,易于理解和解释,可为人类决策提供参考,通常为某个具体应用场景构建,可提供更精准和针对性的知识支持;

2)可解释性好:以结构化形式表示知识 ,知识的可访问性、可重用性、可解释性好,对人类友好;

3)可扩展性强:知识图谱的内容可以随着应用场景的需要进行不断扩展和更新,可以不断完善和改进。

而多模态知识图谱的缺点在于:

1)推理能力弱:只能表示已有的知识和关系,对于未知或不确定的领域难以进行有效的知识建模和推理;

2)人工成本高:其构建需要依赖于人工或半自动的方式进行知识抽取和建模,难以实现完全自动化;

3)架构调整难:其基本schema架构通常是静态的,不易根据新的数据或场景进行修改和调整。

由上分析可见:多模态大模型的优点常常是多模态知识图谱的不足,而多模态大模型的不足又往往是多模态知识图谱的优势。因此,我们认为:当前阶段,大模型与知识图谱仍应继续保持竞合关系,互相帮助,互为补充。

04

AIGC for MMKG

第四部分,我们思考与展望一下AIGC大模型如何辅助MMKG的构建与应用。

d2bd29d2-d9b9-11ed-bfe3-dac502259ad0.png

第一,AIGC大模型为知识获取降本增效。

(1)通过知识诱导(萃取),可以快速获取大量知识或常识。例如,我们可以从语言大模型中诱导语言知识和关系知识;我们也可以从多模态大模型中诱导跨模态对齐知识和视觉常识知识。

d2c5aa30-d9b9-11ed-bfe3-dac502259ad0.png

(2)AIGC大模型的出现使得零样本、少样本、开放知识抽取成为可能。例如,我们可以利用ChatGPT对话大模型的理解和生成能力,从给定文本中抽取三元组知识;我们也可以利用多模态AIGC大模型的跨模态生成和理解能力,从给定图文数据中抽取多模态知识。

d2cdaef6-d9b9-11ed-bfe3-dac502259ad0.png

(3)AIGC大模型可以显著增强垂域多模态知识获取能力。GPT-4、ChatPDF模型等已经显示了强大的领域知识抽取能力,如基于多模态文档的知识抽取。

d2d9fbe8-d9b9-11ed-bfe3-dac502259ad0.png

第二,AIGC大模型助图谱设计一臂之力。

大模型在部分领域上拥有领域常识知识,可以辅助完成schema的半自动化设计。在多模态场景中,也有一些尝试,例如可以用多模态AIGC大模型生成cms领域的schema。

d2e34270-d9b9-11ed-bfe3-dac502259ad0.png

第三,AIGC大模型为知识推理保驾护航。

基于大模型的跨模态生成与推理能力,可以辅助完成KG表示学习、图谱补全等任务。

d2ed6c3c-d9b9-11ed-bfe3-dac502259ad0.png

第四,AIGC大模型为知识融合扫清障碍。

利用大模型的泛化能力和海量知识,可以辅助完成多模态知识图谱融合。利于对于两个MMKG的对齐,多模态AIGC大模型在两者之间可以生成实体知识或语义层面的特征,辅助完成实体对齐。

d2f4e7fa-d9b9-11ed-bfe3-dac502259ad0.png

第五,AIGC大模型为知识更新舔砖加瓦。

基于大模型的常识知识和通用抽取能力可以辅助MMKG进行知识更新。可以利用多模态AIGC大模型从新事实中辅助抽取新知识;当新知识抽取完成后,可以借助多模态AIGC大模型辅助更新多模态知识图谱。此外,还可以借助多模态AIGC大模型辅助过期事实检测,从而将过期知识从知识图谱中删除。

d2fdf4ee-d9b9-11ed-bfe3-dac502259ad0.png

第六,AIGC大模型为知识问答锦上添花。

利用大模型的语言理解能力和解析能力,可以帮助更好的构建多模态知识问答系统。在ChatGPT的知识问答评测结果显示其在很多问题类型上效果显著,且跨语言低资源情况下具有碾压级效果,但是其数值类问题效果不及SOTA。因此,使用AIGC大模型助力MM-KGQA和K-VQA等任务,可以提升问题解析能力,强化知识推理能力,提供外部知识辅助等。

05

MMKG for AIGC

第五部分,我们总结与展望一下MMKG如何助力AIGC大模型的提升与完善。

d304f3ca-d9b9-11ed-bfe3-dac502259ad0.png

第一,MMKG参与AIGC大模型的生成能力评估。

基于多模态知识图谱中的知识构建测试集,可对大模型的生成能力进行各方面评估。例如利用各类百科知识图谱进行事实性检验评估,也可以利用各类MMKG构建测试集进行符号推理能力评估、视觉常识推理能力评估、非语言推理能力评估等。

d3123c60-d9b9-11ed-bfe3-dac502259ad0.png

第二,MMKG引导AIGC大模型的可控约束生成。

已有工作在文本AIGC模型中引入指定约束(如包含/避免某主题)进行可控生成。可以展望未来会出现多模态知识引导大模型约束生成的工作。比如对于图像生成,可通过将文本链接到多模态知识图谱的具体实体,提供实体图像信息,帮助正确生成实体对应图像;对于文本生成,通过链接到多模态知识图谱的具体实体,提供实体关系属性和实体图像等实体画像信息,帮助正确生成符合实体性质和特点的文本。

d322c8b4-d9b9-11ed-bfe3-dac502259ad0.png

第三,MMKG帮助AIGC大模型进行知识编辑。

目前已有在文本大模型上的知识编辑的相关工作。可以预见,未来也会出现利用多模态知识图谱来对多模态大模型进行知识编辑的研究工作。

d32ddaba-d9b9-11ed-bfe3-dac502259ad0.png

第四,MMKG辅助AIGC大模型的领域(任务)适配。

用多模态知识图谱做领域知识微调可以将大模型的能力适配到领域任务。例如,在电商领域跨模态检索场景,常常存在语义不匹配的问题。这种情况下,大模型如何低成本、高效率地解决该领域的具体问题是其应用落地的关键。我们与阿里合作的这篇工作提出了通过微调大模型,加上多模态知识辅助的方式,实现了大模型的轻量级领域适配。

06

AIGC+MMKG

第六部分,我们展望一下AIGC大模型和MMKG如何进一步合作。

d337a658-d9b9-11ed-bfe3-dac502259ad0.png

我们认为,走向通用人工智能需要AIGC大模型和MMKG携手并进。在未来,基于知识工程和统计模型的语言认知和多模态感知将会相互结合,并且借助MMKG和AIGC大模型,共同走向多模态认知的发展道路上。从视觉感知和语言认知到多模态认知,从连接主义和符号主义到神经符号主义,通用人工智能必将是一条融合之路。

d33db142-d9b9-11ed-bfe3-dac502259ad0.png

AIGC和MMKG的第一种融合方式是注入知识以增强预训练大模型。目前知识增强的预训练语言模型已有多种路径实现。在多模态知识增强预训练的方向上,也有工作将场景图知识融入视觉语言预训练模型的预训练过程中以增强跨模态语言理解能力。未来还有很多方式方法来将MMKG中的知识以更多方式融入到大模型当中。

d347a8aa-d9b9-11ed-bfe3-dac502259ad0.png

AIGC和MMKG的第二种融合方式是基于知识检索增强的多模态生成。例如,给定文本提示,访问外部多模态知识库以检索相关图文对,将其用作生成图像的参考。

d3532a54-d9b9-11ed-bfe3-dac502259ad0.png

AIGC和MMKG的第三种融合方式是因果知识增强的多模态生成。已有工作利用因果图谱中的因果关系和图推理能力,辅助大模型的因果决策,通过在因果图谱上的检索、推理和融合将因果信息融入大模型推理中。可以展望,未来因果知识也可被用在对多模态大模型的理解与生成能力优化上。

d365289e-d9b9-11ed-bfe3-dac502259ad0.png

AIGC和MMKG的第四种融合方式是个性化知识接入的多模态生成。在未来,或许每个个体或企业都会拥有AI私有化助手,那么如何管理个性化多模态知识,诸如个人画像知识图谱、企业画像知识图谱、价值观知识图谱、自媒体知识图谱等,将这些知识以一种可插拔式的方式接入AIGC大模型中,提高大模型的个性化生成能力将是非常值得探索的方向。

d36fd08c-d9b9-11ed-bfe3-dac502259ad0.png

实际上,Microsoft 365 Copilot就可以看作是知识库与大模型良好协作的一款划时代产品。借助Microsoft Graph(可以看做是一种知识库)与AIGC大模型的协作融合,助力Word、PowerPoint、Excel的生产力大提升。

d378b09e-d9b9-11ed-bfe3-dac502259ad0.png

此外,在行业落地层面,AIGC大模型和MMKG的融合更具价值。由于利用海量通用语料和通用知识训练的通用大模型与行业应用场景之间依然存在鸿沟,因此需要进行行业数据挖掘和行业特色知识获取来进一步训练更加实用的行业大模型。

d380f704-d9b9-11ed-bfe3-dac502259ad0.png

基于上述原因,行业落地往往需要多层次的模型,并有效与知识库和外部工具进行配合,才能真正解决好行业问题。通用多模态预训练生成大模型、行业领域预训练模型、任务小模型以及行业知识库、外部工具将构成一个模型共同体,协作解决行业复杂问题。

07

总 结

d38c726e-d9b9-11ed-bfe3-dac502259ad0.png

最后总结一下本次分享的主要观点。首先,AIGC技术的发展必将加速迈向通用人工智能的步伐。但是仅凭AIGC技术无法真正实现通用人工智能。在多模态领域,MMKG的构建与应用仍具重要价值。我们认为,AIGC和MMKG应该相互借力,我们分别从AIGC用于MMKG、MMKG用于AIGC、MMKG和AIGC如何融合三方面给出了二者竞合方式的探索和展望。未来,符号知识和统计模型的竞合方式有待进一步深入探索。

审核编辑 :李倩

  • AI
    AI
    +关注

    关注

    86

    文章

    21863

    浏览量

    257285
  • 深度学习
    +关注

    关注

    72

    文章

    4524

    浏览量

    119293
  • ChatGPT
    +关注

    关注

    8

    文章

    511

    浏览量

    1619
收藏 人收藏

    评论

    相关推荐

    为什么TouchGFX模态窗口需要设置背景才能工作呢?

    我想设计一个模态窗口来遮挡屏幕。根据不同的情况,它会显示不同的小部件。我只想显示没有模态窗口背景的小部件。但看起来模态窗口类需要背景来绘制其子项。有什么建议吗?提前致谢。
    发表于 12-22 07:04

    科技大厂竞逐AIGC,中国的ChatGPT在哪?

    企业在技术基础和创新环境上都存在着相对优势。 首先,国内持续投入大模型研发、技术基础扎实。目前,阿里达摩院的模态大模型M6参数量已达10万亿,是全球最大的AI预训练模型;华为盘古、百度文心等大模型
    发表于 03-03 14:28

    模态窗口的设置问题

    Labview中,一个窗口如果设置为模态窗口,则打开后,点击其他窗口应该是没有作用的。我设置的几个子VI为模态窗口,效果都没有问题。但有一个子VI,设置为模态窗口,打开后,点击其他窗口的按钮,虽然
    发表于 11-28 21:56

    经验模态分解

    各位大神,谁能支持基于labview编程的经验模态分解程序,感谢各位的大神。江湖救急呀
    发表于 12-02 20:23

    labview 模态分析

    用labview进行模态分析,有很多问题,望高手指点一二力锤激励信号+加速度传感器信号,请问下,labview什么控件可以计算系统的模态还是说仅仅两路信号是分析不了模态的。
    发表于 06-24 11:50

    关于LabWindows/CVI的模态与非模态窗口的问题,恳请大家帮帮忙

    使用LabWindows/CVI建立多线程时,在子线程中用到了MessagePopup函数,本来MessagePopup函数的弹出窗口是模态窗口,但是程序运行时却是非模态窗口。我现在是必须得在子线程
    发表于 05-14 21:17

    专家支招:物联网时代,嵌入式工程师该这样转型!

    开放的态度去学习。正所谓海纳百川,有容乃大。另外,由于知识的爆炸性增长,嵌入式工程师需要重视对知识的管理,所谓好记性不如烂笔头,写技术博客,有利于总结经验,提高开发速度。同时由于开发模式的转变,如今
    发表于 10-13 09:17

    航空电子设备PCB组件的实验模态分析

    就是通过求解系统的特征方程,一般自由度系统的特征方程可以成式(1)所示的形式,来得到系统的特征值和特征向量,亦即振动系统固有频率和振型。  式中,[M]-系统的质量矩阵,有限元模态分析中由单元质量矩阵
    发表于 09-13 16:40

    『深思考』打造人工智能机器大脑,让AI更懂你!

    的问题”杨志明说。深思考人工智能机器人(iDeepWise.ai)4.0在模态深度语义理解方面有突出优势。深度语义理解使得机器人能够理解上下文,与人进行轮交互。让机器与人的交流更加流畅,更接近于人与人之间
    发表于 09-13 09:40

    模态测试的基础知识

    模态测试应用指南(56 页)概述了结构动力学、采集频率响应数据的测量流程、参数估计(曲线拟合)、用于结构分析的分析方法及其与实验验证的关系......
    发表于 04-03 14:15

    LMS Virtual Lab 流固模态分析

    LMS Virtual Lab 流固模态分析的主要步骤:1、设置材料、属性、约束条件,进行结构有限元模态分析。注意:模态计算的频率范围不要太小,否则可能计算错误!2、对流体进行模态分析3、建立结构网格到流体网格的映射,再利用结构模态和流体模态进行流固耦合模态分析
    发表于 05-29 06:59

    时代工程师期望使用什么样的仪器?

    每个时代工程师都见证了一代新仪器的诞生。40/50年代,他们(工程师们)使用的是阴极射线示波器和指针万用表,现在通常称这些仪器为“模拟”仪器。60/70年代,则基于模数转换器和图形显示的“数字
    发表于 08-20 07:21

    KGB知识图谱基于传统知识工程的突破分析

    知识图谱本质上是一种大规模的语义网络。从2012年谷歌提出知识图谱,知识图谱一直在快速发展,其应用也不再局限于“语义网络”范畴。现如今的知识图谱在实际应用中,主要作为大数据时代知识工程出现。和传统
    发表于 10-22 15:25

    抗混淆滤波器怎么实现混合信号和模态传感器调节?

    一些传感器信号调节器用于处理多个传感元件的输出。这种处理过程通常由模态、混合信号调节器完成,它可以同时处理数个传感元件的输出。本文对这类传感器信号调节器中抗混淆滤波器的工作情况进行详细分析。
    发表于 04-21 06:59

    如何利用信号调节器的抗混淆滤波器来实现混合信号模态传感器调节

    一些传感器信号调节器用于处理多个传感元件的输出。这种处理过程通常由模态、混合信号调节器完成,它可以同时处理数个传感元件的输出。本文对这类传感器信号调节器中抗混淆滤波器的工作情况进行详细分析。
    发表于 04-22 06:35

    简单的模型进行流固耦合的模态分析

      本次分享,对一个简单的模型进行流固耦合的模态分析,有限元科技小编主要给大家演示如何使用Hypermesh与Nastran对流固耦合的结构进行模态分析,以及了解声腔对结构模态的影响。  深圳市
    发表于 07-07 17:15

    如何培养<龍傳人>的科学创新思考技术

    假设性思维,只是当时人们没有意会这种思考逻辑;例如,孔子们生记载(符号化、知识化)了孔子思考的结果(对象),却没有留下(符号化、知识化)假设性思考过程。于是,假设性思维没有传承下来,无法积累,甚至式微
    发表于 12-28 09:45

    时代工程师期望使用怎样的仪器?

    时代工程师们需要怎样的仪器?
    发表于 04-30 07:24

    为什么数字工程师需要射频知识

    为什么数字工程师需要射频知识
    发表于 05-20 06:41

    松灵新品丨全球首款模态®ROS开发平台LIMO来了,将联合古月居打造精品课程 精选资料分享

    地形通过性和场景的适应性一直是无人驾驶、机器人等场景化所需要突破的难题。通过多模态运动融合,提高跨维度运动的柔性适应能力是一种理想的解决方式,这决定了机器人和移动平台未来应用场景开拓的深度和广度
    发表于 08-30 08:39

    CSI工作模态分析

    CSI拓扑CSI开关状态CSI工作模态分析CSI与VSI的联系
    发表于 11-15 07:38

    输变电工程新材料的应用研究与展望

    本文主要讲述的是输变电工程新材料的应用研究与展望
    发表于 04-24 11:39 21次下载

    模态CCD相机辐射校正方法研究

    模态CCD相机可以根据地物辐亮度的差异,调节相机的积分时间和增益以获取理想的影像数据。如何对不同积分时间和增益设置下获取的数据进行辐射校正,是数据定量化运用的关键。
    发表于 02-25 11:22 10次下载

    基于自适应并行结构的模态生物特征识别

    传统模态生物特征识别方法当出现生物特征缺失时,识别性能会明显下降。针对此问题,提出一种融合人脸、虹膜和掌纹的自适应并行结构模态生物识别方法。该方法在设计融合策
    发表于 11-09 16:12 34次下载
    基于自适应并行结构的<b>多</b><b>模态</b>生物特征识别

    知识工程知识管理

    知识工程知识管理2003-4-机械工业出版社
    发表于 04-13 15:17 11次下载

    知识工程知识发现

    知识工程知识发现-2000-12-冶金工业出版社-杨柄儒
    发表于 04-13 15:29 11次下载

    lABCIWQmultyWindows模态窗口2010

    lABCIWQmultyWindows模态窗口2010。
    发表于 05-17 17:47 0次下载

    中国物联网大会_闪联模态组网技术标准与IoT应用

    中国物联网大会_闪联模态组网技术标准与IoT应用
    发表于 12-26 16:00 19次下载

    尺度形态滤波模态混叠抑制方法

    尺度形态滤波模态混叠抑制方法_曹莹
    发表于 01-07 18:21 0次下载

    双摆杂技机器人DD2UD的模态混合控制_但远宏

    双摆杂技机器人DD2UD的模态混合控制_但远宏
    发表于 02-07 18:37 0次下载

    自适应并行结构的模态生物特征识别

    自适应并行结构的模态生物特征识别
    发表于 10-16 11:06 11次下载
    自适应并行结构的<b>多</b><b>模态</b>生物特征识别

    基于模态特征数据的标记迁移学习方法的早期阿尔茨海默病诊断

    针对当前基于机器学习的早期阿尔茨海默病(AD)诊断中训练样本不足的问题,提出一种基于模态特征数据的标记迁移学习方法,并将其应用于早期阿尔茨海默病诊断。所提方法框架主要包括两大模块:标记迁移学习
    发表于 12-14 11:22 3次下载

    文化场景下的模态情感识别

    自动情感识别是一个非常具有挑战性的课题,并且有着广泛的应用价值.本文探讨了在文化场景下的模态情感识别问题.我们从语音声学和面部表情等模态分别提取了不同的情感特征。包括传统的手工定制特征和基于深度
    发表于 12-18 14:47 0次下载

    模态生物特征识别系统框架

    针对模态生物特征识别系统并行融合模式中使用方便性和使用效率方面的问题,在现有序列化模态生物特征识别系统的基础上,提出了一种结合并行融合和序列化融合的生物特征识别系统框架。框架中首先采用步态
    发表于 01-02 18:47 0次下载
    <b>多</b><b>模态</b>生物特征识别系统框架

    基于超图的模态关联特征处理方法

    传统的模式识别方法认为特征是相互独立的,容易忽略模态特征之间多元的关联性,从而造成识别的误差。为此,基于超图模型,提出一种新的特征整合方法。定义共享熵的计算方法用以表示多个特征之间的关联程度,以
    发表于 03-07 11:01 0次下载
    基于超图的<b>多</b><b>模态</b>关联特征处理方法

    基于层次注意力机制的模态围堵情感识别模型

    在连续维度情感识别任务中,每个模态内部凸显情感表达的部分并不相同,不同模态对于情感状态的影响程度也有差别。为此,通过学习各个模态特征并采用合理的融合方式,提出一种基于层次注意力机制的模态维度情感
    发表于 04-01 11:20 8次下载
    基于层次注意力机制的<b>多</b><b>模态</b>围堵情感识别模型

    基于联合压缩感知的模态目标统一跟踪方法

    针对模态目标跟踪中大多仅考虑单个图像的异种特征融合或不同模态图像的同种特征融合,为了使得这两者间能自然集成,提出基于联合压缩感知的模态目标统一跟踪方法。通过将模态跟踪问题转化为多重2-范数
    发表于 04-27 15:59 0次下载
    基于联合压缩感知的<b>多</b><b>模态</b>目标统一跟踪方法

    基于注意力神经网络的模态情感分析方法

    近年来,越来越多的人热衷于在社交媒体上同时用图片和文本等媒体形式表达自己的感受与看法,使得以图片和文本为主要内容的模态数据不断増长。相比单模态数据,模态数据包含的信息更丰富,更能揭示用户的真实
    发表于 04-28 14:41 8次下载
    基于注意力神经网络的<b>多</b><b>模态</b>情感分析方法

    ADPD4000/ADPD4001:模态传感器端数据Sheet

    ADPD4000/ADPD4001:模态传感器端数据Sheet
    发表于 05-11 11:24 2次下载
    ADPD4000/ADPD4001:<b>多</b><b>模态</b>传感器端数据Sheet

    模态MR和特征融合的GBM自动分割算法

    模态MR和特征融合的GBM自动分割算法
    发表于 06-27 11:45 29次下载

    旋翼飞行器设计与控制的前景展望

    旋翼飞行器设计与控制的前景展望
    发表于 09-14 09:57 1次下载

    思考篇:《模拟工程师袖珍参考》的内部故事

    思考篇:《模拟工程师袖珍参考》的内部故事
    发表于 11-04 09:50 0次下载
    <b>思考</b>篇:《模拟<b>工程</b>师袖珍参考》的内部故事

    3G时代无线视频通信技术发展和应用展望

    3G时代无线视频通信技术发展和应用展望 2009 年新年伊始,国内期待已久的3G牌照终于发放,三大国际3G制式均各有归属。中国移动获得国人拥有自主知识产权的TD-SCDMA运
    发表于 11-20 10:58 484次阅读
    3G<b>时代</b>无线视频通信技术发展和应用<b>展望</b>

    闪联+德州仪器模态组网技术标准暨芯片模组发布会即将召开

    为了深入推动闪联模态组网技术标准发展及产业化推广工作,闪联产业联盟会同重要会员TI(德州仪器)等企业在深圳召开闪联模态组网技术团体标准暨芯片模组发布会,共促物联网同行交流及合作,特此诚邀行业人士共同参加此次大会。
    发表于 10-17 16:18 432次阅读

    闪联丁路宁:模态组网技术标准如何与物联网结合

    12月2日,在电子发烧友主办的第三届物联网大会智慧城市分论坛上,闪联信息技术工程中心CTO丁路宁带来《模态组网技术标准和落地前景》的主题演讲。丁总介绍了闪联模态无线组网标准是在现有的多种无线通信
    发表于 12-29 15:42 1416次阅读

    LED照明新时代思考和行动

    国星光电白光事业部技术总监谢志国博士在“上游芯片技术创造下游应用新局面”发表了题为《LED照明新时代思考和行动》的主题演讲。
    的头像 发表于 06-13 18:39 4684次阅读

    以智能音箱为主的智能硬件持续增长 交互模式也从单模态模态转变

    近年来,以智能音箱为代表的智能硬件市场持续增长,交互模式从单模态模态转变的趋势也日益显著。带屏幕的智能硬件能够更好满足听觉和视觉的交互,也是人工智能和硬件厂商发力的方向。
    发表于 12-14 13:49 781次阅读

    智能客户服务中心推动进入"AI+"时代

    创新人机协作服务方式,构建智能数据运营体系,形成决策辅助管理模式,促进传统客户服务中心向知识运营中心和数据决策中心转型,打造跨职能、全渠道、模态的智能客户服务中心,推动客服进入"AI+"时代
    的头像 发表于 12-23 15:02 4865次阅读

    5G推动AIoT落地 模态AI芯成必然

    继去年5月在行业率先推出首款面向物联网的AI芯片—雨燕(Swift)及其系统解决方案之后,1月2日,国内领先的人工智能企业云知声在京召开新闻发布会,正式公布了其模态AI芯片战略与规划。会上同步曝光
    发表于 01-03 15:59 1279次阅读

    关于模态机器学习综述论文

    因此,当研究问题或数据集包括多个这样的模态时,其特征在于模态。 本文主要关注但不仅仅关注三种形式:自然语言既可以是书面的,也可以是口头的; 视觉信号,通常用图像或视频表示; 和声音信号,编码声音和口头信息,如韵律和声音表达。
    的头像 发表于 01-21 13:38 7942次阅读

    苹果解决无人车安全新专利,专为夜间自动驾驶研发的模态传感系统

    这是一个利用红外线设备解决自动驾驶夜间识别率低问题的模态传感系统。
    的头像 发表于 07-06 11:41 2836次阅读

    神经模态芯片发展的方向 神经模态芯片技术解析

    Intel发布了基于其神经模态(neuromorphic)计算芯片Loihi的加速卡Pohoiki Beach,该加速卡包含了64块Loihi芯片,共含有八百万个神经元。继IBM发布True
    发表于 09-15 15:41 520次阅读
    神经<b>模态</b>芯片发展的方向 神经<b>模态</b>芯片技术解析

    大咖齐聚、干货满满!2019炬芯Techlife模态交互技术开发者大会与你共享!

    技术的思考,给大家带来了更多新的灵感和火花。 也感谢各位参加活动的小伙伴,感谢你们见证了炬芯 Techlife 的成长,共同经历并贡献了炬芯科技 Techlife 模态交互技术开发者大会的高光时刻和心动瞬间。 我们也将会议的精彩内容和大家分享,再现大咖的精彩分享,和大家共
    的头像 发表于 12-21 16:03 1420次阅读

    炬芯科技 2019 模态交互技术开发者大会:AI模态交互如何助力教育

    2020年AI模态交互技术将会迎来较大爆发。12月19日,在炬芯科技第四届Techlife炬芯2019模态交互技术开发者大会上,来自喜马拉雅、达摩院、玩瞳科技、IP方CEVA的行业大咖们,从内容
    的头像 发表于 12-24 11:46 1.3w次阅读

    模态生物识别成趋势

    模态生物识别是指整合或融合两种及两种以上生物识别技术,利用其多重生物识别技术的独特优势,并结合数据融合技术,使得认证和识别过程更加精准、安全。
    的头像 发表于 03-11 14:26 2931次阅读

    模态成AI行业发展新风向 新基建行业进入快车道

    近日,由蚂蚁金服牵头制定的“生物特征识别模态融合国际标准”正式立项,这一标准的制定,对于模态领域发展与技术规范产生了重大影响。
    发表于 03-31 11:46 2695次阅读

    AI全新应用场景 技术趋势模态学习

    新的 AI 技术发展趋势有哪些?模态学习技术一定是其中之一。
    发表于 07-18 09:19 1732次阅读

    百度研制知识增强的跨模态深度问答技术等在内的的应用系统

    同时,百度还研制了知识增强的跨模态深度语义理解方法,通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现从看清到看懂、从听清到听懂,即图像和语言、语音和语言的一体化理解。
    的头像 发表于 09-16 14:48 1752次阅读

    关于未来机器学习研究和前沿问题的思考展望

    问题的思考展望。本文为大家节选、整理了此次对话。 Christopher Bishop(左)与 Peter Lee(右)线上对话Christopher Bishop:很高兴能与 Peter Lee
    的头像 发表于 10-16 11:53 2338次阅读

    模态生物识别系统的原理及局限性

    随着技术的发展,使用生物识别技术实施安全个人识别协议的挑战正在增加,并且在世界上几乎每个市场中对于准确的人类识别的需求都比以往更高。生物识别管理市场的并行发展已经确定,用于识别目的的单个硬件模态的使用可能不再是许多行业的最明智的选择,那模态生物识别系统有哪些优势?
    的头像 发表于 10-09 15:30 2146次阅读

    一文解析模态生物识别技术的安全性

    模态生物特征识别是指在识别系统中使用两种或更多种生物特征的组合,例如,结合人脸识别和虹膜识别的系统可以被认为是模态生物识别系统,那模态生物识别技术安全吗?
    发表于 10-13 09:45 580次阅读

    一种无监督下利用模态文档结构信息帮助图片-句子匹配的采样方法

      引 言   本文介绍了复旦大学数据智能与社会计算实验室 (Fudan DISC) 在AAAI 2021上录用的一篇关于模态匹配的工作:An Unsupervised Sampling
    的头像 发表于 12-26 10:26 1544次阅读
    一种无监督下利用<b>多</b><b>模态</b>文档结构信息帮助图片-句子匹配的采样方法

    模态中NLP与CV融合的方式有哪些?

    最早接触模态是一个抖音推荐项目,有一些视频,标题,用户点赞收藏等信息,给用户推荐作品,我当时在这个项目里负责用NLP部分上分,虽然最后用wide and deep 整个团队效果还可以,但是从a/b
    的头像 发表于 12-31 10:12 4239次阅读
    <b>多</b><b>模态</b>中NLP与CV融合的方式有哪些?

    通用人工智能的模态通用技术

    intelligence)期望机器能像人一样思考、推理,能处理各种任务,比肩人类的智能水平(human-like or human-level intelligence)。与强人工智能相比,现有通用人工智能更加
    的头像 发表于 02-04 10:44 4956次阅读
    通用人工智能的<b>多</b><b>模态</b>通用技术

    Transformer模型的模态学习应用

    随着Transformer在视觉中的崛起,Transformer在模态中应用也是合情合理的事情,甚至以后可能会有更多的类似的paper。
    的头像 发表于 03-25 09:29 7267次阅读
    Transformer模型的<b>多</b><b>模态</b>学习应用

    简述文本与图像领域的模态学习有关问题

    来自:哈工大SCIR 本期导读:近年来研究人员在计算机视觉和自然语言处理方向均取得了很大进展,因此融合了二者的模态深度学习也越来越受到关注。本期主要讨论结合文本和图像的模态任务,将从模态预训练
    的头像 发表于 08-26 16:29 5678次阅读

    2021 OPPO开发者大会主会场:模态、简单AI,赋能开发者价值实现

    2021 OPPO开发者大会主会场:模态、简单AI,赋能开发者价值实现
    的头像 发表于 10-27 10:49 921次阅读
    2021 OPPO开发者大会主会场:<b>多</b><b>模态</b>、简单AI,赋能开发者价值实现

    如何使用模态信息做prompt

    Multimodal Conditionality for Natural Language Generation 研究的任务场景则是以模态信息作为条件做 conditional 的 NLG任务。这种任务设置有
    的头像 发表于 11-03 09:39 1172次阅读
    如何使用<b>多</b><b>模态</b>信息做prompt

    模态分析定义以及模态假设理论

    模态分析的经典定义为,将线性定常系统振动微分方程组中的物理坐标变换为模态坐标,使方程组解耦,成为一组以模态坐标及模态参数描述的独立方程,以便求出系统的模态参数。
    的头像 发表于 04-26 10:43 885次阅读

    实现模态的神经形态感知提供了一种新型硬件方案

    论文中,课题组以装有水的杯子为例对模态感知进行了说明:通常对于只有压力信息的单模态感知来讲,我们只能知道杯子的形状、以及杯中的水量,并不能获悉杯中的水温。如果想同时得知杯子形状、水量以及水温,那么就得引入另一个温度模态的信息。
    的头像 发表于 07-28 09:14 699次阅读

    模态图像合成与编辑方法

    本篇综述通过对现有的模态图像合成与编辑方法的归纳总结,对该领域目前的挑战和未来方向进行了探讨和分析。
    的头像 发表于 08-23 09:12 520次阅读

    基于模态语义SLAM框架

    本文提出了一个鲁棒且快速的模态语义 SLAM 框架,旨在解决复杂和动态环境中的 SLAM 问题。具体来说,将仅几何聚类和视觉语义信息相结合,以减少由于小尺度对象、遮挡和运动模糊导致的分割误差的影响。
    的头像 发表于 08-31 09:39 804次阅读

    基于图文模态领域典型任务

    图文模态领域典型任务如img-text retrieval、VQA、captioning、grounding等,目前的学术设定难度尚可。但是, 一旦知识范围扩展,到了open-ended
    的头像 发表于 09-01 17:14 842次阅读

    机器学习模态落地存在哪些挑战

    模态技术有着相当广泛的应用场景,如淘宝搜图、AI字幕、AI虚拟数字人、仿人交互、智能助手、商品推荐和信息流广告、视频帧人脸帧的图向量检索、语音交互等等。
    发表于 10-11 15:20 319次阅读

    面向社交媒体的模态属性级情感分析

    另一方面,相比于单一的文本数据,模态数据包含了多种不同信息,这些信息之间往往一一对应、互为补充,如何对齐不同模态的内容并提出有效的模态融合机制是一个十分棘手的问题。
    的头像 发表于 10-19 10:10 841次阅读

    基于模态智慧感知决策的S230芯片

    提到模态融合感知, 我们难免会觉得有些困惑 “模态”,可理解为“感官” 模态即将多种感官融合 不够直观? 那今天我们就以一道竞猜题开场 请根据以下线索猜猜这是什么物品?
    发表于 11-03 11:59 284次阅读

    AIGC是什么 AIGC有哪些应用价值

    AIGC 即 AI Generated Content,利用人工智能技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。2022年AIGC高速发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。
    的头像 发表于 11-17 09:24 4278次阅读

    为什么不同模态的embedding在表征空间中形成不同的簇

    文中将一些经典的模态对比学习模型中两个模态的embedding,通过降维等方法映射到二维坐标系中。
    的头像 发表于 12-05 14:06 203次阅读

    昆仑万维重磅发布AIGC全系列算法与模型,领跑未来

    、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。   昆仑万维CEO方汉表示,“昆仑天工之所以选择开源
    的头像 发表于 12-16 13:28 336次阅读

    一个真实闲聊模态数据集TikTalk

    随着大量预训练语言模型在文本对话任务中的出色表现,以及模态的发展,在对话中引入模态信息已经引起了大量学者的关注。
    的头像 发表于 02-09 09:31 355次阅读

    AI下一个风口来临 AIGC产业生态迎来发展快车道

    一是基础的生成算法模型不断突破创新;二是预训练模型引发了AIGC技术能力的质变;三是模态技术推动了AIGC的内容多边形,让AIGC具有了更通用的能力。
    发表于 02-10 11:53 386次阅读

    ChatGPT技术:AIGC对算力有哪些需求?

    算力是AIGC应用背后的关键,AIGC对算力有哪些需求?企业若想大力发展AIGC,在算力方面方面应该做哪些部署?
    发表于 02-15 14:32 692次阅读

    AIGC和ChatGPT什么关系 AIGC应用平台有哪些

     AIGC指的就是利用人工智能技术来生成内容。像AI绘画、AI写作等都属于AIGC的应用分支。人工智能是近几年比较火的话题,从刚开始有零星的几台人工智能机器人,到现在的虚拟偶像、AI绘画,科技在时光的流转中悄然进步。
    的头像 发表于 02-16 17:42 6260次阅读

    除ChatGPT以外还有哪些好玩的AIGC软件

    ChatGPT最近有火就不用说了,今天来说说看除了ChatGPT,还有哪些好好玩的AIGC软件? AI Generated Content(AIGC)是利用人工智能技术生成的内容。这种技术
    发表于 02-21 10:23 4443次阅读
    除ChatGPT以外还有哪些好玩的<b>AIGC</b>软件

    中文模态对话数据集

    随着大量预训练语言模型在文本对话任务中的出色表现,以及模态的发展,在对话中引入模态信息已经引起了大量学者的关注。目前已经提出了各种各样的模态对话数据集,主要来自电影、电视剧、社交媒体平台等
    的头像 发表于 02-22 11:03 163次阅读
    中文<b>多</b><b>模态</b>对话数据集

    被ChatGPT带飞的AIGC,能为垂直产业做些什么?

    若考虑到 AIGC 产业应用,如在制造业、建筑业等巨型垂直实体领域中,AIGC 的 C/Content 内容将不能仅停留在图片和文字的领域,而是需要进入信息更为丰富的三维领域。接下来,我们将从
    的头像 发表于 02-23 10:16 1739次阅读

    AIGC最新综述:从GAN到ChatGPT的AI生成历史

    本调查全面回顾了生成模型的历史、基本组件、AIGC 从单模态交互和模态交互的最新进展。我们从单峰性的角度介绍了文本和图像的生成任务和相关模型。我们从模态的角度来介绍上述模态之间的交叉应用。最后,我们讨论了 AIGC 中存在的开放性问题和未来的挑
    的头像 发表于 03-13 10:13 788次阅读

    微软模态ChatGPT的常见测试介绍

    研究者将一个基于 Transformer 的语言模型作为通用接口,并将其与感知模块对接。他们在网页规模的模态语料库上训练模型,语料库包括了文本数据、任意交错的图像和文本、以及图像字幕对。
    发表于 03-13 11:23 370次阅读

    GTC23 | 锁定网易瑶台 AIGC-3D 技术分享精彩演讲

    (AI Generated Content),基于 AI 技术进行图文、视频乃至 3D 模型的泛内容生成,正在引发 Web 3.0 时代的技术浪潮,引领着 3D 内容生产方式变革。通过图片、视频、点云等模态数据自动生成 3D 内容,快速实现现实场景的数字化,成为当前理论研究和行业实践的重大命题。 网易瑶
    的头像 发表于 03-19 22:45 97次阅读

    摩尔线程与光环新网和光环云达成战略合作

    当前,以ChatGPT为代表的AIGC应用持续升温,极大提升了数字内容的生产力和效率。数据显示,预计2023年AIGC市场规模将超过万亿元。而生成算法、预训练模型、模态技术作为驱动AIGC发展的关键,对所需要的算力网络支持提出了更高要求,将产生巨大的算力市场,推动传统数据中心向智算中心加
    的头像 发表于 03-23 11:23 887次阅读

    AIGC变革地产行业 商汤科技携手中原地产发布房产营销AIGC解决方案

    AIGC时代,地产行业正在迸发新想象。       近日,商汤科技与中原地产达成战略合作,共同推出SenseMARS原境空间房产营销AIGC解决方案。   中原地产是房地产代理行业及相关服务领域
    的头像 发表于 03-27 18:59 1047次阅读

    ChatGPT/AIGC研究框架原理和应用实践

    随着ChatGPT等语言大模型落地,AIGC技术落地在各行各业中得到发展和推进。根据模型的分类,AIGC的应用可被分为单模态模态两类。单模态模型可以助力各个应用,提升原有的能力和生产力。
    发表于 03-30 10:35 223次阅读

    高性能计算与深度学习技术下的AIGC如何引领人工智能与全球化的发展?

    AIGC也可以通过智能化的方式来推动全球公民意识的发展,为全球公民意识的建设带来新的机遇。因此,我们应该更加重视AIGC与人工智能技术的发展,为智能化时代的发展做出更大的贡献。
    的头像 发表于 03-31 16:33 659次阅读
    高性能计算与深度学习技术下的<b>AIGC</b>如何引领人工智能与全球化的发展?

    什么是模态分析?为什么要进行模态分析?

    模态:物体按照某一阶固有频率振动时,物体上各个点偏离平衡位置的位移是满足一定的比例关系的,可以用一个向量表示,这个就称之为模态
    的头像 发表于 04-04 10:39 119次阅读

    哈工大南洋理工提出全球首个「模态DeepFake检测定位」模型:让AIGC伪造无处可藏

    具体而言,在模态媒体篡改中,各类新闻报道的图片中重要人物的人脸(如图 1 中法国总统人脸)被替换,文字中关键短语或者单词被篡改(如图 1 中正面短语「is welcome to」被篡改为负面短语「is forced to resign」)。
    的头像 发表于 04-11 09:30 132次阅读

    下载硬声App