Sora其实引用日语“天空”,引申的含义还有“自由”, 就像OpenAI官网的这些图片一样,纸飞机在天空自由飞来飞去,向人们表现出Sora无限的创造潜力。
虽然还未正式发布,但是Sora的一些样片还是让大家惊呼AI进化的速度,因为用文本自动生成视频实在是太逼真了!
01一夜之间,Sora爆火
Sora的问世,同时令海内外的AI从业者、投资人彻夜难眠。在龙年的首个交易日里,AI概念股全线大爆发,成为市场焦点,Sora概念、多模态AI、AIGC、CPO板块集体大涨,Sora则成为当下全行业最火爆的话题。
Sora概念板块2月19日、20日走势图源:Wind
看热闹不嫌事多,也不乏有网友在线调侃……
图源:新浪微博
图源:央视新闻官微
央视新闻报道称,视频场景逼真、色彩丰富、氛围浓厚,清澈灵动的眼眸、活泼可爱的萌宠、神秘莫测的海底世界...全部由人工智能系统制作生成。
OpenAI官方解释,Sora可以根据文本生成一段时长最多60秒的逼真视频,先说这个60秒,当下的AI视频工具,最多也就15秒,光是时长已经无人能及了。另外一个就是逼真,有多逼真,小为下面发几个视频截图看看。
1根据文本生成视频
需求:格伦芬南高架桥是英国苏格兰一座历史悠久的铁路桥,横跨马莱格镇和威廉堡之间的西部高地线。当蒸汽火车离开桥,在拱形覆盖的高架桥上行驶时,景象令人惊叹。风景上点缀着郁郁葱葱的绿色植物和落基山脉,为火车之旅创造了风景如画的背景。天空蔚蓝,阳光灿烂,是探索这个壮丽景点的美好一天。
Sora生成的视频截图
图源:B站
2根据图片生成视频
需求:根据图片生成一段脑袋转动的视频,等等
图源:B站
Sora生成的视频截图
图源:B站
3根据视频融合生成视频
给出两个视频,A和B,输入你的要求,Sora可以将A和B融合在一起,还可以多角度展示,就算这几个视频没有什么关联,依靠AI技术,也能实现自然融合。
4其他能力
还有一些其他的能力,大家随便看看,小为毕竟不是AI大拿。
02人工智能将如何改变世界?
Sora的问世,给行业带来了无限可能性,因此网友开始预测它将会影响甚至颠覆哪些行业,影视制作、广告、游戏、新闻媒体、教育、社交媒体等等。随着一系列AIGC(利用人工智能技术生成内容)相继问世,让众人直言对现代社会生活产生颠覆性影响的“AI革命”逐步来临。AI聊天、AI绘画、AI音乐……
中国互联网协会副理事长、伏羲智库创始人李晓东分析,人工智能经历六七十年的发展,目前被广泛应用到科技创新、文化产业和工业制造等领域。算力提升和成本降低,也让通用人工智能来到普通百姓的身边。
可以预见在不久的将来,人工智能将无处不在,推动信息化技能从数字化、网络化,全面进入到智能化时代。“很快我们将不再讨论人工智能,因为人工智能已经融入到生活中,无处不在。”李晓东说。
回顾当下AI的发展,我们畅想未来的的人工智能世界
生成式AI可将输入内容,变成小说、电影、艺术作品
谷歌公司旗下的人工智能模型“巴德”,可以根据你输入的多个词语迅速生成一篇短篇小说或诗歌。
DALL-E可以把你输入的任何内容变成艺术作品。
为了训练DALL-E,研发公司为它提供了约6亿张来自互联网的标签图片。通过深度学习,它不仅可以理解单个物体,还可以学习不同物体之间的关系。
生物医疗、无人驾驶、气象预报…AI技术市场规模巨大
马斯脑机接口公司“神经连接”完成首例脑机接口设备人体移植,移植者状态良好。
据悉,这项技术是完全可植入的,由电池供电且是无线,全程通过蓝牙连接。
清华大学医学院脑机接口研究团队与首都医科大学宣武医院联合,于2023年10月成功进行全球首例无线微创脑机接口临床试验。
这位因车祸造成脊髓损伤、四肢瘫痪14年的患者,经术后三个月康复训练,已实现自主喝水等脑控功能,抓握准确率超过90%。
2023年7月,华为云盘古气象大模型正式上线欧洲中期天气预报官网,让世界看到中国大模型破解气象领域难题的能力。
世界银行估计,改进天气预报和早期预警系统每年不仅可带来价值1620亿美元的收益,还可以挽救约23000人的生命。
交互式AI带你探索体验虚拟现实的无限美好
未来我们戴上交互式AI,说一句:“带我去南极”,瞬间,你就置身在冰天雪地的世界,跟着企鹅们嬉戏玩耍。
图源:ChatGPT生成
你也可以说:“我要去马尔代夫晒太阳”,一转眼,你就置身于阳光沙滩上了。
图源:ChatGPT生成
到时候还需要大房子吗?AI的存在,全世界都可以是你的家。
图源:Apple Vision Pro官网
也许我们虚拟世界周边的一切,将会是如此地真实,每一缕阳光, 每一粒沙,都是如此的真实。你耳边的风声、朋友的欢笑声、小猫的叫声,也让你无法分辨他们到底来自于真实还是虚拟的世界。
但是,你其实不需要那个旋转的陀螺,就很容易地知道,这不是一个真实的世界。
因为,这个世界没有味道。
03AI暂时给学化学和生物的留了一条生路
人的嗅觉其实是极其灵敏的,对于某些化合物,其灵敏度甚至超过了大多数气相色谱和质谱。这个也涉及到小为Genever的色谱耗材产品,更多耗材黑话可以参考往期干货物,这期小为继续猜AI是如何暂时给学化学和生物的留了一条生路的。
接着往下说,就好像带着Vision pro在虚拟的马尔代夫沙滩上晒太阳, 但是却无法闻到海水的咸味。在虚拟世界中跟好友畅游在重庆街头,却闻不到一丝丝火锅的味道。这些时候,我们可能还是会感觉,这个世界还不够真实。
虽然依靠强大的算力,AI很可能在不远的未来就能实现文生世界的功能,但是绝大多数都是基于视觉和听觉的感官刺激。而嗅觉是某些化学物质刺激到鼻腔内的嗅觉感受器,从而产生电信号传递到神经系统。
图源:ChatGPT生成
如何能够随时随地得到我想要的味道,AI未来将如何实现呢?这需要计算,更需要实际化学分子的合成和释放。这并不是一件简单的事情。这也就是小编为什么大胆猜想,AI给学化学的人还留了生路。
AI可以做到随时根据生成的世界给我提供想要的味道吗?
当然,现在味道模拟已经在VR的游戏中有了应用,有些是基于预设的场景。比如在军事射击类的VR游戏中,整合了味道生成器的VR头盔可以在游戏中散发柴油和烟雾的味道。美食VR游戏可以给你提供有热狗味道的虚拟热狗。
其实,要将除了视觉和听觉以外的其他感官,包括嗅觉、味觉、触觉都整合到虚拟世界,甚至达成完美的全感官体验,还有一条路径,我们可以想到马斯克Neuralink的脑机接口。如果直接模拟各种感官刺激在神经上产生的电信号,就直接跳过了对于刺激本身的模拟。那还需要合成什么化学分子啊?你想要的,全变成电信号直接传递给大脑就行了。
英伟达的黄教主在最近的采访中说道,不建议年轻人读计算机、学编程了(别误导),而是去更多探索生命的秘密。这是小编为什么大胆猜想,AI给学生物的人也留了生路。
图源:ChatGPT生成
当然,如果有一天,全感官的虚拟世界能够被我们随意生成,那我们好像已经离黑客帝国描绘的场景不远了。到时候,红色和蓝色的药丸,你选哪个?你愿意在大脑里植入芯片来看电影、玩游戏、旅游等体验虚拟世界,还是带着类似Vision pro这些头戴式设备呢?
图源:ChatGPT生成