雷霆影视

 找回密碼
 立即註冊
搜索
查看: 4|回復: 0

指的是能同时处理

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2024-2-19 17:54:48 | 顯示全部樓層 |閱讀模式
举例而言,李未可Met Lens S搭载了大型语言模型I系统,你可以通过语音的方式与设备闲聊、获得一些健身、旅游行程方面的建议等。你可以面向设备询问各种五花八门的问题,有时候还会获得一些意想不到的回复。 Met Lens S的“吐槽垃圾桶”功能 (图源:VR陀螺) 物体识别:这也是R眼镜常见功能之一,较为典型的产品是Ry-Bn Met,它将在今年引入建筑识别、菜单/路牌翻译等功能。国内雷鸟X、RKnovv 等产品也内置了识物功能,不过基于当前体验来看,设备的物体识别准确率还有待提升。 海外的Envision Glsses则另辟蹊径为眼镜开发了一项人脸识别功能,它可以识别生活中亲朋好友的面孔,用以解决一些患有视障或者脸盲症的用户群体的社交问题。 雷鸟X识图功能(图源:VR陀螺) 生活/办公助理:目前已经有部分I智能终端显露出了“I gent”的苗头,在这一方面i Pin走在了前列。i Pin与用户的社交生活进行了深度绑定,如用户可通过语音指令驱动设备向亲友发送符合心意的聊天回复;I可以帮助用户快速整理邮件并提取有价值的信息;I可以提供生日礼物购买建议并快速下单等。


除i Pin外,我们也可以从Rokid设备中看到类似的用例。Rokid在去 购买 TG 数据库 base年Rokid Jungle活动期间亮相了空间搜索功能,当用户搜索网页、视频等内容时,系统会根据信息的权重呈现出不同的排列方式,该功能不但兼顾了R的使用直觉,同时也通过I功能进一步提升了用户对于信息的获取效率。 图源:Rokid 图生图:目前R眼镜设备关于“I生成内容”的玩法仍以文生文体验为主,文生图、文生视频等体验则相对稀缺。RKnovv 是目前为数不多的支持I图生图的眼镜产品,眼镜可以对其拍摄画面进行“二创”以生成风格多样化的图片,并支持导出到社交平台。该功能背后依赖于开源大模型Stble Diffution。 RKnovv 的R创作功能(图源:VR陀螺) 二、多模态I是众望所归,全天候I是北极星指标 如果说年是“I+R”的小试牛刀,那么年便是其进一步爆发的节点。有消息指出,在新的一年中,华为、科大讯飞等更多厂商会进一步入局R眼镜市场,以实现市场占位。从功能来看,预计“I+R”将会迎来以下新变化: 多模态I 目前R眼镜所采用的多为单模态I大模型,这使得产品的玩法相对单一,难以实现更复杂的多元信息处理能力。



未来我们有望看到多模态I在眼镜终端的进一步应用落地。 所谓多模态I,文本、图像、音视频、代码等多种信息的人工智能,它的信息处理方式更接近于人类的“所看、所听、所想”。近期谷歌所发布的Gemini正是多模态I的代表之一,从演示视频中我们可以发现Gemini可以“理解”用户在纸上所画的内容,并能结合用户的对话交流给予相应的反馈。 Gemini演示视频(图源:谷歌) 无独有偶,Met也正在为Ry-Bn Met引入多模态I能力,去年年底扎克伯格展示了基于智能眼镜的一个服装搭配使用场景:当眼镜镜头对准衣服,I不仅可以识别衬衫的样式,并且还能进一步给出相应的穿搭建议。在这么一个简单的场景中,其实需要调用自然语言处理、图片识别、推理等多种能力,这些都是单模态I所难以实现的。


您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |