终于有正经 AI 硬件了,一台能写诗的「拍立得」 终于有正经 AI 硬件了,一台能写诗的「拍立得」
admin
2024-05-04 15:43:58
0


人工智能并不只想「人工」,它也想搞搞艺术。


作者 | Moonshot
编辑| 靖宇

2016 年,由人工智能撰写《电脑写小说的那一天》小说成功通过了日本「星新一文学奖」的初选;Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人,让他们以为这就是巴赫本人的创作。

如今,人工智能已经能生成真假难辨的视频,极具艺术感的图像。

人工智能正在挑战着文学、音乐、绘画、影视等等这些原本属于艺术创作的领域。当艺术难以成为人类对抗 AI 的护城河后,许多人认为,诗歌或许是智能时代,人类最后被攻克的堡垒

诗歌被认为是人类文学最初的起源,在尚未有文字的人类社会,诗歌就以口语的形式流传在文明里。它在形式上考验节奏和韵律,在表达上考验想象和凝练,它需要表达者把经验、观察、意识结合,毕竟诗歌的创作依托于于人类特有的通感,因此我们可以让 ChatGPT 写一首关于月亮的诗,它只会泛泛而谈,而无法和人类在当时当刻,设身处地看到独一无二的月亮。

但是,如果 ChatGPT 有了能「看到」月亮的能力,给思考赋予观察呢

基于这个想法,Kelin Carolyn Zhang 和 Ryan Mather 两位设计师和开发者鼓捣出了一台设备:让摄影机去「所见」,让人工智能去「所感」,用技术的手段去实现文学里最难以量化的表达。

这就是诗歌相机(Poetry Camera)

01

相机与诗

诗歌相机内核搭载了树莓派,一个只有信用卡大小的微型电脑,得以成像和调取 GPT-4 的 API,这就打通了设备的「眼睛」和「大脑」。

举起诗歌相机,随便拍下一张照片,计算机视觉算法会开始分析视觉数据,人工智能模型开始解释图像,识别图像里关键元素、颜色、环境、影调情绪等信息,生成诗,并且以类似超市收银条的方式打印出来,就好像拍立得「洗」出照片一样。

拍照出诗不出片,这可比拍立得更让人有期待和惊奇感。不看宣传看效果,它能生成怎样的诗歌呢?


图源:TechCrunch

有用户拍下了早上自己在家里喝咖啡时玩手机的样子,诗歌相机的创作是:

镜头后面,一人调整视线,

在正方范围里的像素空间。

日光透过褪色的薄纱,

他手上,温热的咖啡流转。

对话传出,跨过虚拟的边界,

他的倒影镜像,在屏幕上出现。

书架上,书本倾斜,无声的喋喋不休,

茂盛的植物,是唯一的生命。

戴着眼镜,家成了他平静的面糊,

在这堵墙里,他的世界四散开来。

在 2024 年 4 月的一个清晨,

一种新的常态,悄悄地磨损。

@poetry.camera

不难看出,哪怕经过简单翻译,它生成的文字依然有诗歌特有的「意象感」。诗歌相机的原文更显用词文法上「刻意地精妙」,比如每一段都在押韵脚,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用词上也会采用诗歌用词,比如把 morning 写成 morn,就像中文里把「早上」写成「晨」一样。


图片来源:TechCrunch

另一演示则是对着纽约公共图书馆的天花板拍张照,它会解读并创作出:

「天花板的影子之舞,

如同金镶木,

用春日天空欺骗了眼睛

石碑和木梁下

伫足」

两位开发者表示,由于诗歌相机的开源属性,用户其实可以根据个人喜好更改源代码,重新编程和选择不同的诗歌形式,不局限于现代自由诗,也可以是日本俳句或七言绝句,后续可能会给用户不同大模型去选择,比如从 GPT-4 换到更擅长理解文字和语义的 Claude,或者更擅长写故事的 Dragonfly。


两位开发者表示「只想享受科技的乐趣」|图源:Poetry Camera

而且诗歌相机不会以任何数字方式保存,用户既看不到相机拍到了什么,也不能直接复制粘贴文本,如果想留存一份,只能拿起手机拍下来这一张诗条。因为两位开发者认为,除了技术问题(需要服务器和云平台)、隐私问题之外,诗歌的瞬时性给它增添了额外的意义,打印出来的「诗条」是瞬时捕捉,随机生成,独一无二的实体存在。

在屏幕主宰我们日常生活的当下,诗歌相机这种设计把视觉以诗意用物理的方式呈现,让它在数字之外,增添了一丝模拟化的浪漫气息。

02

你我都能做

「拍下所看到的景观,让相机生成诗歌」这一想法不仅富有创意,似乎看着还挺难实现的?但实际上,你我都可以做出一台诗歌相机。

诗歌相机到现在也还停留在一个「艺术项目」的阶段,两位开发者也暂未有大规模商业化的计划。他们只是产生诗歌相机的想法,鼓捣出了一台能实现想法的硬件,他们所用到的软硬件都是开源的,因此两位开发者选择在网站上把详细的制作过程公开,鼓励更多的用户 DIY 自己的诗歌相机。

诗歌相机的内核是微型卡片计算机树莓派,再附以一些常见配件,再加上树莓派的相机模块、一台迷你热敏打印机、六个电池、一个按钮就够了。


官方把详细的 DIY 教程发到了 GitHub|图源:Poetry Camera GitHub

而诗歌的生成则要对接到 ChatGPT-4 的 API 密钥,在按下快门时,会触发脚本,把采集到的图片发送到 GPT-4 上创建一首诗,最后在热敏收据打印机上打印出来。

两位开发者已经写好了全流程脚本,只要按照他们给的详细步骤逐步设置,不需要会编程和 3D 打印,纸壳里也能造出一台诗歌相机。


两位开发者的调试用机|图源:flomerboy

如果说乔布斯所信奉的「技术和人文的十字路口」让他造出了极具美感的数码产品,那诗歌相机则是用一种互动形式上的创新,给予我们另一种技术和现实交互的可能,突破界限,创造新的表达形式,甚至进一步反向激发人类的观察和想象。

这也是两位开发者秉持的理念:技术应该融入生活,让我们能更好地欣赏日常,而不是挤压人类的生存空间

联合创始人 Kelin Carolyn Zhan 坦言道诗歌相机的意义所在「对我来说,这仍然是艺术,它是关于表达的。诗歌相机是一台塑造我们想要看到的世界的工具,这也是一个人们可以把玩新技术的世界:人工智能并不全是厄运和悲观,也不仅仅是用更深、更快、更糟糕的方式模仿人类,而是用新技术创造全新的工具,再让工具再次带出人类内心的孩子。对于这个项目来说,这不是为了赚钱——而是为了让那些天真的奇迹再次成为可能。」

但在创意之外,我们又不得不产生疑惑:GPT-4 生成的诗已经模有样,那在诗的创作上,超越人类是否只是时间问题?

03

人工智能写的诗,

能和人比吗?

当我们站在赏鉴的角度再看诗歌相机的成诗,可以感受到人工智能和诗人作诗上的差异所在,人工智能写的诗有更明显地「描述」和「顺序」,用词上更连贯,比如「日光透过褪色的薄纱」「天花板的影子之舞,」,更像是用文雅的词描述一个场景,其中缺少了诗歌难以描述的抽象感和意象美。

就像诗刊社在《GPT时代,诗歌的意义和价值所在?》里提到的,「GPT 的出现是对文本顺序的改变,它省略了世界与作者的概念,中间加入的是标准化、数字算法,却没法模仿诗歌的意象。


诗人夏宇所写的现代诗|图源:夏宇

诗人欧阳江河也曾在采访里说到「写作背后的广阔性是人的生命、人的世界观。这些包括了生命的感动、生命的升华、生命的伤痛、生命的恐惧、生命的黑暗、生命的爱、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聪明了,它没有疼痛,没有生命的脆弱感和恐惧,而诗歌正是这些的产物。如果没有这样的来源,只剩下漂亮的句子是没有意义的。」

诗不像围棋或公式,诗没有确定的答案,当我们质疑人工智能写诗的能力,我们更多是在质疑它诗的由来

就像在 1982 年的科幻电影《银翼杀手》里,人造人罗伊·巴蒂在死前留下了全片最富有诗歌气息的台词,这意味着人类,至少《银翼杀手》的创作团队相信,在共同经历了对生命的感受之后,人工智能体也能创作出优美且富有人性的诗歌。


罗伊·巴蒂死前独白|图源:银翼杀手

回到诗歌相机上,在我们了解这个设备后,并没有感受到一种「被人工智能挑战」的紧迫感,反而是新奇更甚,毕竟当我们触手可及的设备能进行一种艺术的表达时,它也随之解锁了我们看待周遭的一种独特的方式。

就像诗人夏宇在 2023 年与 ChatGPT 合作完成了一册诗集《验证您是人类》,她和 ChatGPT 探讨诗、评论、语言、机器、笑话……最终她在采访里说道「人类至上的人类又在搞机器人,处处代入人的语法人的意图动机人的情感……与ChatGPT的沟通,透过它习得的人类语言,它也学得很快,我还是希望它保留它的机械性不要轻易进入人性。」

与其去较真人工智能和人类在写诗上还有多少差距,甚至产生精神危机感。我们更应该关注,用算法和数据喂饱的人工智能是怎样观察被我们忽视的周遭,它又能否激发出人类的诗性。

*头图来源:Poetry Camera

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你还接触过哪些有趣的 AI 项目

欢迎在评论区留言告诉我们


相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...