发布时间:2025-08-06 14:30:19 | 浏览量:334
【导语】眼睛,是生命探索世界的窗口。从人类到节肢动物,视觉系统的进化展现了自然界的奇妙与智慧。节肢动物的复眼结构,以其高效、灵活的特性,成为了科学家们灵感的源泉。如今,一项突破性的研究在上海理工大学与美国杜克大学的联合努力下诞生——一种体积仅0.8立方厘米的仿生复眼相机(BCE)成功问世。这款智能虫眼(yǎn)不仅能够实现165°超广视角和40微米高分辨率的全彩全景成像,还借助人工智能技术,实现了图像的高效重(zhòng)建与精准(zhǔn)识(shi)别(bié)。这(zhè)一(yī)创(chuàng)新(xīn)成(chéng)果(guǒ),或(huò)许(xǔ)将(jiāng)引(yǐn)领(lǐng)未(wèi)来(lái)视(shì)觉(jué)技(jì)术(shù)的(de)新(xīn)篇(piān)章(zhāng)。
蜻(qīng)蜓(tíng)复眼碾压单反?中国造出0.8cm³智能虫眼
眼睛,是生命投向宇宙的第一缕目光。从人类第一次睁开双眼凝视这个世界开始,视觉就成为了我们感(gǎn)知(zhī)环(huán)境(jìng)、理(lǐ)解(jiě)世(shì)界(jiè)最(zuì)重(zhòng)要(yào)的(de)方(fāng)式(shì)。为(wèi)了(le)突(tū)破(pò)肉(ròu)眼(yǎn)的(de)局(jú)限(xiàn),拓(tà)展(zhǎn)视(shì)觉(jué)的(de)边(biān)界(jiè),精(jīng)密(mì)的(de)视(shì)觉(jué)技(jì)术(shù)愈(yù)发(fā)令(lìng)人(rén)惊(jīng)叹(tàn):超(chāo)高(gāo)速(sù)摄(shè)像(xiàng)机(jī)能(néng)够捕捉每秒百万帧甚至千万帧画面,让子弹飞行、水滴溅落的瞬间清晰可见;X光和核磁共振透视人体,让医生无需开刀就能(néng)洞察病灶;以及那些搭载在卫星上的遥感相机,正在从太空俯瞰地球的每一个角落。
然而有一类生物早在5亿年前就已经进化出了超越想象的视觉系统,它们无需任何精密的仪器,不依赖复杂的电路,仅凭着与生俱来的复眼结构就能实现许多我们梦寐以求的视觉功能。这就是节肢动物,一个占据地球80%以上动物物种的庞大家族。它们的复眼如同天(tiān)然(rán)的(de)生(shēng)物(wù)相(xiāng)机(jī)阵(zhèn)列(liè),由(yóu)不(bù)定(dìng)数(shù)量(liàng)的(de)小(xiǎo)眼(yǎn)组(zǔ)成(chéng),可(kě)能(néng)是(shì)数(shù)个(gè),也(yě)可(kě)能(néng)是(shì)数(shù)以(yǐ)千(qiān)计(jì),每(měi)个(gè)小(xiǎo)眼(yǎn)都(dōu)是(shì)一(yī)个(gè)独(dú)立(lì)的感光单元。
例如螳螂虾,它拥有地球上最复杂的视觉系统,能够感知12-16种基础颜色。要知道,我们人类只有三种视锥细胞,也就是说只能看到红、绿、蓝三原色的组合。再比如蜜蜂,能够看见紫外线世界里的隐形地图,这是花卉在紫外线下留下的蜜导标记,指引着蜜蜂准确找到花蜜的位置。以及令人讨厌的苍蝇,之所以轻易躲开我们的追击,都归功(gōng)于(yú)复(fù)眼(yǎn)超(chāo)强(qiáng)的(de)动(dòng)态(tài)视(shì)觉(jué)能(néng)力(lì)。而(ér)且(qiě),这(zhè)一(yī)切(qiè)都(dōu)是(shì)在(zài)极(jí)低(dī)的(de)能(néng)耗(hào)下(xià)完(wán)成(chéng)的(de),这(zhè)种(zhǒng)能(néng)量(liàng)效(xiào)率(lǜ)令(lìng)我(wǒ)们(men)最(zuì)先(xiān)进(jìn)的(de)电(diàn)子(zi)设(shè)备(bèi)都(dōu)望(wàng)尘(chén)莫(mò)及(jí)。
那(nà)如果我们能够借(jiè)鉴(jiàn)复(fù)眼(yǎn)的(de)设(shè)计(jì)原(yuán)理(lǐ),结(jié)合(hé)现(xiàn)代(dài)人(rén)工(gōng)智(zhì)能(néng)技(jì)术(shù),会(huì)不(bù)会(huì)创(chuàng)造(zào)出(chū)一(yī)种(zhǒng)全新(xīn)的(de)视(shì)觉(jué)系(xì)统(tǒng)?一(yī)种(zhǒng)既(jì)拥(yōng)有(yǒu)生(shēng)物(wù)复(fù)眼(yǎn)的(de)灵(líng)活(huó)高(gāo)效(xiào),又(yòu)具(jù)备(bèi)人(rén)工(gōng)智(zhì)能(néng)的(de)理解能力的智能仿生眼?
2025年5月,一项发表在《Science Advances》上的研究为我们带来了新的突破性的答案。

上海理工大学与美国杜克大学的联合研究团队成功开发了一种仿生复眼相机,以节肢动物视觉为模型,能够产生165°视角和40微米分辨率的全彩全景图像。让我们先来理解一下这些数据意味着什么。165度的视角是什么概念?我们的双眼大约只能看到120度范围内的景象,这代表着这个仿生复眼能看到我们身侧的物体。而40微米的分辨率相当于能清晰分辨出比头发丝还细一半的物体,这已经接近了许多专业显微镜的水平。
更值得惊叹的是,这个被称为BCE(Biomimetic Compound Eye,仿生复眼)的神奇装置体积仅有0.8立方厘米——比一颗方糖还要小。在这么小的空间里塞进了足足127个精密排列的小眼单元。每一个小眼都像是一台微型探测器,它们协同工作,共同构建出一幅完整的世界图景。

要制造这样一个精密的装置,传统的加工方法显得捉襟见肘,于是研究团队采用了微流控辅助的3D打印。3D打印大家已然不陌生,但普通的3D打印机打印一个茶杯可能就需要几个小时,且打印精度也就在零点几毫米。而这项研究使用的3D打印技术,能够在液体环境中进行超精密打印,精度达到了微米级别。我们头发的直径也才几十微米,而微米级3D打印技术的精度不亚于在头发丝上进行雕刻。
整个制造过程就像是微观世界的建筑工程:首先,在直径仅5毫米的半球形基底上,3D打印出127个蜂窝状排列的微型空间。然后利用液体的表面张力在每个空间里精确地形成一个完美的微透镜。而每个小眼单元都包含两个关键部件:顶部的微透镜负责聚焦光线,就像我们相机的镜头;下面的锥形光波导则像是一根根超细的光纤,负责将收集到的光线传导到底部的图像传感器。这种设计几乎完美复制了昆虫复眼的结构:在蜻蜓的复眼中,每个小眼也是由透镜和感光细胞组成的。
但这个精(jīng)妙(miào)的(de)硬(yìng)件(jiàn)设(shè)计(jì)只(zhǐ)是(shì)故(gù)事(shì)的(de)一(yī)半(bàn)。如(rú)果(guǒ)直(zhí)接(jiē)观(guān)察(chá)BCE相(xiāng)机(jī)采集的(de)原(yuán)始(shǐ)图(tú)像(xiàng),我(wǒ)们(men)可(kě)能(néng)会(huì)大(dà)失(shī)所(suǒ)望(wàng)。BCE相(xiāng)机(jī)获(huò)取的原始图像呈现典型的复眼成像特征:由于127个独立小眼单元的光学视场存在重叠,单个目标在未处理的原始数据中会产生多重伪影。如图所示,一个手写数字8在视场内会形成6个重复影像,这是由仿生复眼的六旋转对称结构导致的固有现象。这种原始数据无法直接用于视觉任务,需依赖多级神经网络实现信息重构。这就是人工智能大显身手的时刻了:研究团队(duì)为(wèi)BCE相(xiāng)机配备了一个三阶段深度学习系统。

第一阶段采用YOLOv5神经网络进行目标检测和三维定位。该网络接收BCE相机采集的3040×3040×3像素原(yuán)始(shǐ)图(tú)像(xiàng),迅(xùn)速(sù)在(zài)纷(fēn)乱(luàn)的(de)信(xìn)号(hào)中(zhōng)锁(suǒ)定(dìng)目(mù)标(biāo)。网(wǎng)络(luò)将(jiāng)检(jiǎn)测(cè)到(dào)的(de)目(mù)标(biāo)在(zài)二(èr)维(wéi)图(tú)像(xiàng)中(zhōng)的(de)中(zhōng)心(xīn)坐(zuò)标(biāo)(xc, yc)和(hé)尺(chǐ)寸(cùn)(w),通(tōng)过(guò)数(shù)学(xué)变(biàn)换(huàn)转(zhuǎn)换(huàn)为(wèi)三(sān)维(wéi)极(jí)坐(zuò)标(biāo)系统中的方位角(α)、方位角(β)和距离(R)。这种转换考虑了BCE的球形结构和每个小眼的空间取向,使系统能够在8毫秒内完成目标的空间定位,角度误差小于2.6度,距离误差小于2.3%。
第二阶段是图像重建的核心环节,采使用ResNet34深度神经网络进行图像重建。它面临的艰巨任务是高效地将127个小眼采集的破碎图像片段重新组装成完整清晰的全景图。为系统利用了BCE六边形排列的对称性,就像我们知道雪花图案的六分之一就能推知全貌。网络首先将目标区域旋转到标准位置,提取感兴趣区域并放大到1024×1024像素进行精细处理。通过层层卷积运算和跳跃连接机制,网络学会了如何将模糊的马赛克图像转换成清晰的256×256像素图像。而这个将分散的小眼图像片段融合成连续的430万像素全景图像的整个过程,仅仅耗时77毫秒,
第三阶段使用MobileNetV2轻量级网络进行模式识别。这个网络的设计理念类似于人脑的视觉皮层:通过19个专门的处理模块逐层提取图像特征,从简单的边缘、形状到复杂的模式,就像把一个复杂的识别任务分解成多个简单步骤。网络会输出两组概率分布:一组判断是0-9中的哪个数字,另一组识别是红、绿、蓝、黄、橙中的哪种颜色。实验结果显示,中央视野的数字识别准确率接近完美,即使是因光波导弯曲而略有变形的边缘图像,识别准确率也保持(chí)在(zài)95%以(yǐ)上(shàng)。而(ér)颜(yán)色(sè)识(shi)别(bié)更(gèng)是(shì)接(jiē)近(jìn)100%的(de)准(zhǔn)确(què)率(lǜ),充(chōng)分(fēn)证(zhèng)明(míng)了(le)这(zhè)套(tào)视(shì)觉(jué)系(xì)统(tǒng)的(de)可(kě)靠(kào)性(xìng)。
在(zài)一(yī)项(xiàng)实(shí)验中,研究人员(yuán)让(ràng)一(yī)个(gè)标(biāo)有(yǒu)数(shù)字(zì)8的(de)目(mù)标(biāo)沿(yán)着(zhe)螺(luó)旋(xuán)轨(guǐ)迹(jī)快(kuài)速(sù)移(yí)动(dòng),同(tóng)时(shí)在(zài)另(lìng)一(yī)处(chù)放(fàng)置(zhì)了(le)静(jìng)止(zhǐ)的(de)数(shù)字0。BCE相机不仅能同时追踪两个目标,还能准确重建它们的图像,定位误差仅为2.3%。

传统单反镜头120°视场已是极限,转身时便错过半个世界。而BCE的165°×360°的全景天眼,如同蜻蜓悬停时同时洞察前、后、上、下的威胁。在反应速度上,整个系统从捕捉到识别仅需90毫秒,比你读完这句话还快。相比之下,专业单反的自动对焦系统在面对快速移动的多个目标时,仍会陷入选择困难症。体积对比更是悬殊。一台单反相机仅机身就重有公斤级,而BCE相机的0.8立方厘米体积,却(què)集成(chéng)了(le)完(wán)整(zhěng)的(de)成(chéng)像(xiàng)、处(chù)理(lǐ)和(hé)识(shi)别(bié)系(xì)统(tǒng)。虽(suī)然(rán)画(huà)质(zhì)上(shàng)目(mù)前(qián)的(de)BCE相(xiāng)机(jī)确(què)实(shí)还(hái)无(wú)法(fǎ)与(yǔ)几(jǐ)千(qiān)万(wàn)像素(sù)的(de)全画幅单反相提并论,但这个仅有方糖大小的智(zhì)能(néng)虫(chóng)眼(yǎn),可(kě)能(néng)正(zhèng)是(shì)打(dǎ)开(kāi)未(wèi)来(lái)视(shì)觉(jué)技(jì)术(shù)大(dà)门(mén)的(de)钥(yào)匙(shi)。
参(cān)考(kǎo)文献(xiàn)
Yan Long et al. ,Seeing through arthropod eyes: An AI-assisted, biomimetic approach for high-resolution, multi-task imaging.Sci. Adv.11,eadt3505(2025).
本(běn)文为(wèi)·创(chuàng)作(zuò)培(péi)育(yù)计(jì)划(huà)扶(fú)持(chí)作(zuò)品(pǐn)
出(chū)品(pǐn)丨(gǔn)中(zhōng)国(guó)科(kē)协(xié)科普部
监制丨中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
作者丨蔡文垂 中国科学院大学博士研究生
审核丨孙明轩 上海工程技术大学 教授
————THE END