编辑:昕朋
【新智元导读】被中文折磨的歪果仁,开始用Stable Diffusion学习汉字!更绝的是,SD不仅精通汉字,还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏!
学习外语,不是件容易事。
当然,这份苦,不只有中国人吃。
在Reddit上,有一个「r/ChineseLanguage」的话题,里头专门发一些外国人学中文遇到的问题的吐槽。
对大部分学习中文的外国人来说,汉字永远是个跨不过去的坎。
没有正确的学习方法,学习者很难记住成百上千个结构各异的汉字。
不过没关系,Stable Diffusion会出手。
字不认识?看「图」!
在Reddit的Stable Diffusion频道,网友分享了文字生成模型Depth2Image。
代码链接:https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt
该模型使用Stable Diffusion的技术,可以将汉字图像转变为它所代表的含义。
例如,用火腿组成的「肉」字,
以及用绳子组成的「绳」字。
博主分享了图像的生成方式,在模型中输入需要呈现的材质照片,Depth2Image就会生成该材质对应的中文汉字。
此贴一出便引来广泛讨论。网友在热情分享自己创作的文字同时,也激动地表示:这在教育领域的应用未来可期!
其实在两年前,已经有人从事文字图像化的研究。推特网友@azlenelza就利用助神经网络,通过生成视觉助记符的方式将汉字图形化,表示各自的含义。
Azlen表示,这种方式会让各个汉字的意义和形状之间建立更多的联系,从而使每个汉字更容易记住。
可以发现,当时AI生成的图像更属于艺术字的范畴。例如右下角的图像,小编看了好久才认出是「制」字。
经过两年的发展,文字图像化的技术更加成熟。有了这项技术,或许真的能帮助汉语学习者更好地掌握每个汉字,在汉语教学领域大放异彩。
字不够用?得「造」!
更绝的是,Stable Diffusion还能造字。
在学习了1万个日文汉字后,Stable Diffusion模型开始为新事物创造「假汉字」,如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。
在这些字中,我们也发现了华点。
Stable Diffusion创造的「马里奥」和本尊相比,不能说毫不相干,只能说是一模一样(好家伙,纯象形字是吧)。
另外,AI模型造的「马斯克」一字也够霸气。称王还不够,直接超级加倍,变「王中王」。
相比之下,卷福和尼古拉斯·凯奇哭晕在厕所。
如果扩大输出图像的尺寸,模型还会整花活,生成一个比二维码还要复杂的「文字」。
密恐人士:6。
评论区有人说:「这不是西夏文吗?」
别说,还真有点像。这AI,知识学杂了。
在中日网友的眼中,这类技术可能只是为了整活。毕竟看惯了本国文字,就算看对方语言的汉字也会感到奇怪。
但对于身处另一套语言系统的人来说,看到一个个结构各异的图像,竟有如此丰富的内涵,或许更能感受到语言和文字的魅力。
巴别塔后,人类文字不通,无法交流;现代科技在克服语言壁垒的同时,又在建造一座新的「巴别塔」。这次,人类会成功吗?
参考资料:
https://twitter.com/hardmaru/status/1614119727416369152?s=46&t=BdjSSthlkb8_b_AWoh4BGw
https://www.reddit.com/r/StableDiffusion/comments/10b3r24/using_depth2image_to_create_images_to_aid/