2024-10-08 20:39 点击次数:195
仍是分不清相聚上的图像和视频是真东谈主如故由 AI 生成的了杉原杏璃作品。
这是我的一位共事在看完最近遭到疯传的 TED 演讲者视频发出的感触,亦然这几天网上数百万东谈主的感受。
要是不是抱着「知谈谜底找问题」的心态去扫视这些视频,不仅咱们难以离别,就连 AI 识别软件也得懵圈。而这般传神的后果,很猛进程上取决于图片过硬的质地。
此前《劈波斩浪》的导演陈坤曾经提到,和传统电视剧拍摄手法有所不同,AI 视频生成主要分两步走:文生图、图生视频。
经过一番深挖,网友发现这个视频的原像片恰是出自 Stable Diffusion 团队的前成员 Leo Kadieff 之手。
他在 LinkedIn 揭秘谈,这些所谓的 TEDx 演讲者像片其实是由 FLUX+LoRA 制作而成的,经过中致使不需要经过任何的微调。
他还暗示,仅需一个 22MB 的小文献,用户就毋庸在每个领导词里堆砌一大堆与真确联系的词汇。浅易一句「一张 RAW 超践诺像片,超高清,8k」就足以照看生成的像片莫得东谈主味的问题。
AI 生成的图片或视频,是否仍是果真毫无东谈主味?
短短几天,仿佛潘多拉的魔盒仍是灵通,越来越多真假难辨的图片/视频正在飞速占领支吾媒体。
不信你再仔细不雅察底下这些像片/视频。
为了幸免稠浊,网友特地给图片打上了笔墨标注,看着咫尺传神的图片和「I am not real」的提醒,如斯割裂的场景,瞬息让东谈主屁滚尿流。
网友共享了几张「2015 年支配的败兴的 Snapchat 像片」,这看起来像是某个番邦友东谈主逝去的芳华,但很缺憾,这实足是由 FLUX 生成的。
不外,也有翻车的案例,比如像底下这张在 TEDx 大会上,身着恐龙服装的模特手抓麦克风,脖子上挂着 Google 标记挂绳的图片,看着 AI 味就很重。
从能引起恐怖谷的「威尔・史小姐吃意大利面」再到如今真假难辨的视频生成,短短不外两年时期,却截然上了一个大台阶。
此外,入室操戈攻子之盾,倘若将图像填塞度调至最高,AI 生成的牙齿就会显得特别诡异,致使图像色调合座也极不调和。
一时期,东谈主类仿佛找到了抗争 AI 图片的新大陆。而这个器具恰是出自 Claude 之手,号称用 AI 魔法击败魔法,有杀毒软件和相聚病毒互撕的那味了。
那这种要领靠谱吗,别急着同意,老章程,咱们得先实测一下。比如我顺手上传了我身旁共事的真确像片,嗯——怎样看着有些不太对劲?
再将马斯克这张最经典的露齿图上传,把填塞度拉到最大,但仔细看下来,似乎也不太相宜上头提到的「牙齿」定律。
不光我这样思,回过味来的网友的质疑声也如潮流般涌向器具原作家的驳斥区。
有些网友合计,高质地的 AI 图片在神气和亮度的均衡上,可能比东谈主类用 Photoshop 剪辑得还要好,而这种识别情势较着有失偏颇。
东谈主们通常通过识别图片压缩和神气变化来判断图片是否由 AI 生成,但这可能是装假的,因为这些特征也可能是由其他身分(如反射名义或后光条目)形成的。
致使同期放出了东谈主类与 AI 生成图片直不雅的识别后果,并径直对着述者一顿贴脸输出。
面临网友的一连串质疑,不屈不住的器具与作家也不再那么「插嗫」,承认了这种识别要领存在的一些弱势。
眼见不一定为实,AI 正在欺凌咱们的活命
正如上头所述,FLUX 恰是出自 Stable Diffusion 原版东谈主马之手。
本月初,Stable Diffusion 的原班东谈主马也开导了新公司——Black Forest Lab(黑丛林实验室)。其中该公司由 Stable Diffusion 的中枢开发者 Robin Rombach 领衔。
公司刚开导,Black Forest Lab 就赢得了 3200 万好意思元的种子轮融资,领投方是闻明风投契构 Andreessen Horowitz(a16z),多位业内知名东谈主士也参与了投资。
Black Forest Lab 推出的首个居品即是名为 FLUX.1 的图像生成模子系列,其中包含了专科版、开发者版和快速版三种版块,这些模子在视觉质地、领导词辞退、图像细节和输出万般性等方面齐达到了新的高度。
FLUX.1 [pro]:顶级性能版块,提供最先进的领导奴婢和图像质地,通过 API 和精选配结伴伴赢得。
FLUX.1 [dev]:开源权重、指点精简的模子,适用于非生意用途,提供与 pro 版块相似的性能但更高效。
FLUX.1 [schnell]:最快的版块,专为土产货开发和个东谈主使用而筹备,基于 Apache 2.0许可证。
据官网袒露,文生图的推出只是是个起初,改日该公司还将策划推出视频生成模子。那时,前 OpenAI 大神 Andrej Karpathy 也在线奉上祝愿,称开源的 FLUX.1 图像模子格外巨大。
适度断事如神,不到两周时期, FLUX 便掀翻了当下的病毒式传播。
与此同期,玩梗的网友暗示,仍是莫得东谈主迥殊阿谁每天提供两次免费生成图片契机的 DALL·E 3 了,因为目前的 FLUX.1 才是艺术家们恒久的神。
而在上周末同期爆火的还有直播版 Deepfake AI 器具——Deep Live Cam。
用户只需一张像片即可在视频或图像中及时换脸,且扫数换脸经过仅需几分钟就能完成,无需依赖于任何专用的硬件加快开导。
当不能寰球首富,但至少不错顶着马斯克的脸过一把寰球首富的瘾,以至于有网友嘲谑,马斯克一醒觉来,发现我方在全寰球直播。
致使有 Reddit 网友发现,在 Google 浏览器上搜索「贝多芬」图片,排行第一的居然是由 AI 生成的肖像。
从前段时期曝出的 AI 笔墨欺凌彭胀至图片/视频鸿沟,越来越多的信息空间正在被 AI 占领。咱们正站在一个令东谈主既振奋又不安的十字街头。
振奋的是,假如一张像片就能作念到视频换脸或及时换脸,放到一些诸如直播以及等行业来说,这是否意味着东谈主东谈主齐是董宇辉的时间正在驾临。
致使不少大牌明星也仍是开动向 AI 出售我方的肖像权。
此前,据说演员布鲁斯·威利斯(Bruce Willis)授权 AI 公司 Deepcake 创建他的「数字替身」,并在改日的技俩中使用他的脸和肖像,而威利斯则毋庸参与任何拍摄或制作。
就这样,在 AI 技巧的重塑下,这位 68 岁乐龄且患有「失语症」的据说影星得以以另一种「弧线」样式重返「大荧幕」。
但不安的是,真东谈主演员的原生特点大略也会被冉冉灭绝,成为导演和制片东谈主手中率性摆弄的乐高,如同活水线一般,少量少量地「拼出」整部影视作品。
在如斯传神的数字形象中,「千闻不如一见」的常理将遭到严峻的检修。
四肢消耗者,又该如何去鉴别视频中的名东谈主们究竟是我方所默契的东谈主类,如故只是作品制作家手中的「提线木偶」?四肢名东谈主,在面临肖像权受到犯科侵害时,又该如何浮现「我」不是我的东谈主生玄学?
即即是放到最为热议的 AI 骗取议题上,当 AI 以最亲近的容貌化身收割普罗全球的镰刀,而现存的法律在这紧锣密饱读的 AI 节律中较着慢了一拍之时,东谈主类又似乎只可无法可想。
多少年后,真确与装假紧闭分不清了。
大略在这类技巧大范围应用之前,咱们只可山不转路转,正如《连线》作家 Jason Parham 曾提议的建议:
av收藏让咱们拥抱被歪曲,接收活命在图像充满了愚弄性的无常中。咱们要保抓接力,因为改日是一个抓续领路和「去领路」,坍塌和重建的游乐场。
下一篇:没有了