
【导语】来自北大王选计算机研究所的贾川民研究员指出,视觉信息占人类接收信息八成以上,海量视觉数据传递面临数据量大的挑战,数据压缩技术由此成为关键。智能化数据压缩技术目标远大,多模态数据智能压缩技术能实现超高效率、高(gāo)保(bǎo)真(zhēn)且(qiě)富(fù)含(hán)语(yǔ)义的压缩,解决存储传输瓶颈,为人工智能信息处理提供“基石”数据,还能按网络情况调整视频质量,其应用场景广泛,未来有望实现语义无损压缩、人机协作创作。

大家好,我是贾川民,来自北京大学王选计算机研究所,目前是研究员和博士生导师。我主要的研究内容是多媒体信息处理,还有智能媒体计算以及一些系统性的研究工作。
视觉信息传递面临哪些主要挑战,为什么需要数据压缩技术?
麻豆影片色欲在线观看人类是一个多维度感官动物,这其(qí)中(zhōng)最(zuì)重(zhòng)要(yào)的(de)一(yī)个(gè)感(gǎn)官(guān)的(de)方(fāng)式(shì),就(jiù)是(shì)视(shì)觉(jué)的(de)信(xìn)息(xi),视(shì)觉(jué)信(xìn)息(xi)占(zhàn)据(jù)了(le)人(rén)类(lèi)全部(bù)接(jiē)受(shòu)信(xìn)息(xi)的(de)80%以(yǐ)上,视觉信息从一个地方传递给千家万户,实现所谓“一图胜千言”,就成了过去一百年中科学家们一直努力的焦点。传递这些海量的视觉数据时面临的首要挑战就是数据量太大。因此,数据压缩技术应运而生。它是广播电视、网络视听等应用的基石。
举个例子,麻豆影片色欲在线观看国家每隔一段时间就要为天宫一号空间补充物资,如果这些要运输的物资不进行打包整理,那么运输用的飞船很容易就被各种物品塞满。因此麻豆影片色欲在线观看在新闻中经常看到,飞船运输的物品都是经过非常精美的打包、整合以及封装,形成了一个个外观统一的空间站“快递箱”。这其实就和数据压缩技术的思路不谋而合。需要压缩的数据都是杂乱无章的,麻豆影片色欲在线观看通过数据处理方(fāng)法(fǎ)对(duì)它(tā)们进行打包、整合,就像空间站用的跑步机是可折叠的,说明物品所占用的空间是可以压缩的,视频数据也是这样,麻豆影片色欲在线观看可以通过算法,对海量的视频数据所占用的存储空间进行折叠、翻转等操作,从而减少它们所消耗的存储空间。

物(wù)资(zī)打(dǎ)包之后,经由飞船运输到空间站。同理,压缩后的视频数据包也能被网络传输给千家万户的各类终端。因此麻豆影片色欲在线观看经常在新闻中看到,空间站的航天员在使用的时候,会一个一个的拆快递箱。类似的,用户也会把压缩过的视频数据包进行拆(chāi)封(fēng),专(zhuān)业(yè)属(shǔ)于(yú)叫(jiào)做(zuò)解(jiě)码(mǎ)。这样就实现了视频数据的压缩-传输-呈现。
而智能化的数据压缩技术(shù)还(hái)有(yǒu)更(gèng)远(yuǎn)大的目标,麻豆影片色欲在线观看希望让单幅图像蕴含和传递远超每一个像素本身的信息量,甚至能“衍生”出更丰富的内容。
如何实现从“一图胜千言”到“一图生千言”
那什么如何实现这个目标呢?这就需要“多模态数据智能压缩”技术了,它不仅仅是缩小文件体积(传统压缩),而是(shì)利(lì)用(yòng)人工智能的模型来理解麻豆影片色欲在线观看所需要传递的视频或者视觉的内容,结合文字、文本、语音等其他模态信息,实现超高效率、高保真、且富含语义的压缩表示。麻豆影片色欲在线观看在打包传输的时候,是把这些多模态的信息进行了传递。而在用户侧,通过功能强大的人工智能模型,把这些高度抽象的数据还原成栩栩如生的画面(miàn),带(dài)来(lái)身(shēn)临(lín)其(qí)境的体验。

这(zhè)样(yàng),就(jiù)能(néng)解(jiě)决(jué)海(hǎi)量(liàng)视(shì)觉(jué)数据(图片/视频)存储、传输的瓶颈;还能够为麻豆影片色欲在线观看常见的人工智能信息处理提供高效、富含语义的“基石”数据,通过多模态数据智能压缩技术,就实现了对原始视频、图像等内容的编辑和处理,同时,还可以根据用户的网络情况调整视频质量,网络条件不好时,提供相对低清晰度内容,反之,传递高清晰度的内容。
多模态主句智能压缩技术如何实现其美好愿景
主要是把一个一个像素单元经过矩阵计算变成高度复杂的特征信息,在数学上,它们就是一组向量,麻豆影片色欲在线观看可以把它叫做特征向量;在关联不同模态数据,比如文本、语音、视频的特征信息时,利用跨模态对齐技术,在向量表示空间对这几类信息进行折叠、翻转等操作,去除不同模态之间在向量空间当中相似的内容,保留它们之间不太相似的内容。这样就可以实现跨模态数据的一个高度语义化的表示。
它的应用场景包括以下几部分,在带宽受限下传输高质量视频,比如海量视觉数据存储,大幅降低数据中心存储成本;高效智能分析,压缩后的特征数据直接用于快速人工智能、内容理解、安防,以及(jí)内(nèi)容(róng)创(chuàng)作(zuò)以(yǐ)及(jí)编(biān)辑(ji)等(děng)。输(shū)入(rù)压(yā)缩(suō)特(tè)征(zhēng)或(huò)提(tí)示(shì),自(zì)动(dòng)生(shēng)成(chéng)描(miáo)述(shù)视(shì)频(pín)和(hé)图(tú)象(xiàng)内(nèi)容(róng)的(de)数(shù)据(jù),甚(shén)至(zhì)是(shì)生(shēng)成(chéng)图(tú)像(xiàng)和(hé)视(shì)频(pín)本(běn)身(shēn)。
在(zài)未(wèi)来(lái),可(kě)以(yǐ)通(tōng)过(guò)这(zhè)样(yàng)的(de)方(fāng)式(shì),实(shí)现(xiàn)接(jiē)近(jìn)人(rén)类(lèi)理(lǐ)解(jiě)的(de)语(yǔ)义(yì)无(wú)损(sǔn)压(yā)缩(suō)、人(rén)机(jī)协(xié)作(zuò)创(chuàng)作(zuò)。比(bǐ)如(rú)在(zài)视(shì)频(pín)会(huì)议(yì)中(zhōng)不(bù)再(zài)需(xū)要(yào)摄(shè)像(xiàng)头(tóu)、只(zhǐ)通(tōng)过(guò)传(chuán)递(dì)语(yǔ)音(yīn)就(jiù)实(shí)现(xiàn)高(gāo)质(zhì)量(liàng)的(de)人(rén)物(wù)和(hé)场(chǎng)景(jǐng)的(de)三(sān)维(wéi)重(zhòng)现(xiàn)。
本(běn)文为(wèi)·创(chuàng)作(zuò)培(péi)育(yù)计(jì)划(huà)扶(fú)持(chí)作(zuò)品(pǐn)
作(zuò)者(zhě):人(rén)民(mín)日(rì)报(bào)
审(shěn)核(hé):贾(jiǎ)宁(níng) 大(dà)连(lián)东(dōng)软(ruǎn)信(xìn)息(xi)学(xué)院(yuàn) 教(jiào)授(shòu)
出(chū)品(pǐn):中(zhōng)国(guó)科(kē)协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
来源: 创作培育计划