橘子百科-橘子都知道橘子百科-橘子都知道

鱼目混珠这个故事,鱼目混珠的典故

鱼目混珠这个故事,鱼目混珠的典故 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人ChatGPT火爆以来,微软公司创始人(rén)比尔(ěr)·盖(gài)茨已多(duō)次公开谈论人工智能话题。在(zài)最近的一次采访中,他再次表示:“AI可(kě)能会(huì)让科技行业迎来一次剧烈的洗牌(pái)”。

这个结论是他在(zài)当地(dì)时间2月20日接受《In Good Company》节目专访时提出的。

他(tā)预期,AI的发(fā)展可能会威胁到谷歌的市占率,因(yīn)为(wèi)微软在AI方面的行动相(xiāng)当迅速。而(ér)最终(zhōng)科技巨(jù)头将把AI整合(hé)成(chéng)用户的“全(quán)能助手”,包揽一切应(yīng)用,与人们进行(xíng)沟通并提供建议,可以取(qǔ)代(dài)亚马逊、Siri或(huò)Outlook等(děng)应用。

大佬口中全能助手(shǒu)的到来可能尚需时日(rì),但由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中(zhōng)杀出重围。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

01

ControlNet颠(diān)覆AI绘画新玩(wán)法

AIGC向可控靠近

以AI绘画(huà)为代表的AIGC上一次爆火的时候(hòu),还是2022年8月,在美国科罗拉多(duō)州举办的新兴数(shù)字(zì)艺术(shù)家竞赛中,一(yī)幅名为《太(tài)空歌剧院(yuàn)》的作品获奖。

随后(hòu)各大厂商(shāng)的AI绘画软(ruǎn)件被广大网友(yǒu)熟知并体验,Stable Diffusion便(biàn)是其中(zhōng)代表。

ChatGPT之(zhī)后又一应用杀(shā)疯了(le),AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正能量

用(yòng)户们可以在应用中输入一组(zǔ)关键词(cí)或者一张照片(piàn),就能获得一(yī)幅AI创作的画作。

作(zuò)画(huà)的关(guān)键(jiàn)就是所输入的文本。同一组(zǔ)关键词也可(kě)以创作出很多张(zhāng)风格(gé)不一样的画作,这让创作的过程(chéng)就像开(kāi)盲盒。

很多(duō)用户很喜(xǐ)欢这种不确定的惊(jīng)喜(xǐ),他们会(huì)将生(shēng)成(chéng)的美图(tú)当(dāng)做头像。而另一部分喜(xǐ)欢翻看AI绘画的“翻车”作品(pǐn)。在(zài)社交媒体(tǐ)上,许多用(yòng)户分享AI“翻车现场”,例如(rú),一位(wèi)网友的小狗照片被AI画成了“肌肉男(nán)”,还有网友的(de)个人照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加持,以往AI绘画的填写关(guān)键词游戏可能要(yào)被颠覆(fù)了。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或(huò)进入可控(kòng)期,将(jiāng)洗牌科技行业?_黑料正(zh<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>鱼目混珠这个故事,鱼目混珠的典故</span></span>èng)能量

ControlNet是一位正(zhèng)在斯坦福读博的中国人张吕(lǚ)敏创(chuàng)作的一种基于控制点的图像变(biàn)形算法,主要用于数字图像(xiàng)处理、计(jì)算(suàn)机视觉和计算机(jī)图形学等(děng)领域。

其(qí)SD插件一(yī)经发布,在短短的两天内便成(chéng)为(wèi)了AI绘画领域最新的热点。

在此之前(qián),大家用了很(hěn)多方法(fǎ)想让AI生成的(de)结果(guǒ)尽可能的符(fú)合要(yào)求(qiú),但是都不尽如人意,它的出现代表着AI生成开始(shǐ)进(jìn)入(rù)真正的可控时期(qī)。

因为ControlNet可以直接提取画面的构图,人物(wù)的姿(zī)势和(hé)画面的深度信息(xī)等。有了它的帮助,就不用频繁(fán)的用提示词来碰运气(qì),抽(chōu)盲盒式的创作了。

通俗的(de)说ControlNet相(xiāng)当(dāng)于给AI绘画加(jiā)了“魔法(fǎ)”,不少博主的(de)作品已(yǐ)经获得了(le)大量的浏(liú)览量(liàng),“viggo”就是其(qí)中之一,他(tā)用朋友的照片直(zhí)接带她们走进动漫世界。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正能(néng)量

viggo先用StableDiffusion图(tú)片转(zhuǎn)文字。

再用Text2Prompt插件拓展找到对(duì)应的关键(jiàn)词(cí);最(zuì)后(hòu)用ControlNet插件绑定骨骼(gé)开始换关(guān)键词(cí)试效果。

ChatGPT之后又一(yī)应用(yòng)杀疯了(le),AIGC或进(jìn)入(rù)可(kě)控期,将洗牌(pái)科技行业?_黑料正能量

通过图片就可(kě)以看出来,效(xiào)果十分(fēn)惊艳。

ChatGPT之后又一应(yīng)用杀疯(fēng)了(le),AIGC或进入可控期(qī),将洗牌科(kē)技行(xíng)业?_黑料正能量

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑(hēi)料(liào)正能量(liàng)

更厉害的是,除了真实的照片(piàn),草图也可以(yǐ)加(jiā)上“魔法”,知乎大(dà)牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现线(xiàn)稿转全彩图。大神张吕敏其本(běn)尊(zūn)也亲自回应。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业?_黑料正(zhèng)能量

不(bù)得(dé)不说当下(xià)AIGC已经变得越来(lái)越强大,甚至(zhì)输出(chū)的作品(pǐn)都(dōu)已经能以假(jiǎ)乱(luàn)真了。

02

难(nán)辨虚实,AIGC技术力爆(bào)发

警惕安全(quán)问题

近日(rì),“苏州金鸡湖有游艇(tǐng)party”的消息火遍网络(luò),而经过警方辟谣这所谓的“party”可能是(shì)全国第一起AI绘图诈骗。

由(yóu)于这个(gè)活动里面给出(chū)的美女照片都(dōu)是AI制作的真(zhēn)人照片绘图(tú),因为太逼(bī)真,被(bèi)大(dà)家当成真(zhēn)事(shì)传播了

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科技(jì)行业?_黑料(liào)正能量

不过仔细观察(chá)可(kě)以(yǐ)发现,活动(dòng)发起者(zhě)提(tí)供的照片中有个很大(dà)的(de)漏(lòu)洞可以发(fā)现并非真人,而(ér)是AI绘图鱼目混珠这个故事,鱼目混珠的典故,那便是图片中女性的手(shǒu)指(zhǐ)部分有的存在异常(cháng)。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科(kē)技行业?_黑料正能量

有行业人(rén)事表示:“现在因为(wèi)手(shǒu)指部分的绘画算法(fǎ)比较复杂,AI还不(bù)太(tài)会画人(rén)的手,但最新(xīn)看到的图(tú)片(piàn)已(yǐ)经(jīng)有越来越完美的AI模型出(chū)现,以后可(kě)能(néng)就完全(quán)没有漏洞了(le)。

类(lèi)似的(de)AI作图诈(zhà)骗(piàn)在国外也已有(yǒu)发生。据(jù)英国广播公司报道,土耳(ěr)其地(dì)震期间,有(yǒu)Tiktok用(yòng)户(hù)使用AI合成(chéng)了(le)儿童(tóng)受(shòu)灾的假照片(piàn)发布到网(wǎng)络,以此诱骗善良(liáng)的人(rén)打赏“捐(juān)助”从而实(shí)施(shī)诈骗。

目前随着技术发(fā)展,AIGC已经能做出真(zhēn)人照片般的绘图效果,如(rú)果这样的图(tú)片被用(yòng)来(lái)诈骗,将非常可(kě)怕。

此外AIGC还引(yǐn)发了(le)很多担忧,一(yī)方面,批(pī)判者认为AI在“学习(xí)”了(le)大量前人(rén)的作(zuò)品之后,其创作没有任何情(qíng)绪和灵魂,难以和人类(lèi)的艺(yì)术(shù)创作相提并论。

另一方面,AIGC背(bèi)后的版权、目(mù)前都并没有得到有效的解决,还有AIGC会不会代替人类(lèi)“至高无(wú)上”的创意。

马斯(sī)克也(yě)强调,人工智能的安(ān)全问题(tí)需要得到重视,太晚(wǎn)就来不及了。

03

AIGC下一站(zhàn)除(chú)了视频,还有(yǒu)远方

技(jì)术都是有两面性的,潜在的危(wēi)害并(bìng)不(bù)能掩(yǎn)盖(gài)其光辉的(de)贡献。现在看来,人工智能技术将是第四次工业革命的核心驱鱼目混珠这个故事,鱼目混珠的典故动力量,将创造新(xīn)的(de)增长奇迹。

过去(qù)一年(nián),人工智能在技术和商业(yè)层面都(dōu)有了巨大进展,AI绘画就是人工智(zhì)能技术(shù)发生(shēng)方向性改(gǎi)变(biàn)的一个代表(biǎo)。其(qí)下一站或许就是视频。

此前,Meta和谷歌先后发布了几条引爆科技圈的短视(shì)频。这些视频引发(fā)关注并非内容(róng)做得多优秀,反而(ér)都非常简单,比如一(yī)匹正在喝(hē)水的马,一只(zhǐ)画画的(de)玩具熊,或者(zhě)一(yī)段骑摩托车的第一视(shì)角录像,随(suí)便一个有手(shǒu)机的(de)人都可以(yǐ)随手录下一段。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期(qī),将(jiāng)洗牌科技行业?_黑料正(zhèng)能量(liàng)

但这些短视频的创作方(fāng)式非(fēi)常简(jiǎn)单,创作者仅仅需要向AI输入一(yī)段话,甚(shèn)至只是说一下要求(qiú),AI就(jiù)可以根据需要生成一段视(shì)频。

谷歌(gē)发布(bù)的两个(gè)AI生(shēng)成视频分(fēn)别来(lái)自于Imagen Video和Phenaki,前者主要突出(chū)的是高清,与Meta的(de)Make-A-Video没有太多的差别。

在Make-A-Video公(gōng)布(bù)了AI生(shēng)成的视频后,AI圈就已经(jīng)玩了一波梗,一个能够做出更(gèng)高清视频的AI还不足以(yǐ)在(zài)短时间内(nèi)戳中兴奋点(diǎn)。

Phenaki更加(jiā)令人震惊(jīng)的地方在于(yú),它可(kě)以制(zhì)作出超过2分钟的连(lián)贯的也有确切内容的视频,这(zhè)才是真正让人们感到惊(jīng)喜的地方。因为无论AI生成的视频多么高清,也只能(néng)是为内(nèi)容生产者提(tí)供(gōng)一个灵(líng)感,一个素材,一个过(guò)场动画。

不(bù)过能够制(zhì)作出有具体剧情内容的视频就(jiù)意味(wèi)着,一些视(shì)频创作由AI代替(tì)人(rén)工完成已经初步(bù)有了可能。

当下AI的发展速度(dù)已(yǐ)经超(chāo)过大部分人的想象。内容产(chǎn)业(yè)的本质是(shì)供(gōng)给创造需(xū)求,AIGC作为全新的(de)内容生产方式,可以为内容产业带来更(gèng)新的内(nèi)容风格、更快的生产(chǎn)速度,更低的(de)生(shēng)产(chǎn)成本(běn),这无疑会驱动内容产业的大(dà)爆发。

除了AI绘(huì)图、视频,AIGC技术还能应用于(yú)音乐、代码、机(jī)器人动作等多种(zhǒng)内容形式(shì)的(de)生(shēng)成(chéng)。不难发现(xiàn)该项(xiàng)技(jì)术不仅(jǐn)在(zài)游戏等(děng)行业(yè)能(néng)得到有效应(yīng)用,对于下一代互联网各种元(yuán)素的构建亦有(yǒu)关(guān)键(jiàn)意义。

从商业(yè)化(huà)的角度来(lái)看,文化(huà)娱(yú)乐、教育(yù)、传媒(méi)等(děng)诸多领域,本身(shēn)就对基于(yú)AI的可(kě)视化内容有强烈需求。

因(yīn)此,AI绘画及视频或不是(shì)结果,而(ér)只(zhǐ)是AI进(jìn)程中的一块重要拼图,有望在(zài)技(jì)术更新(xīn)的(de)加(jiā)持下实现更大的应用(yòng)价(jià)值。

AI从(cóng)理(lǐ)解(jiě)内容(róng),走向了可以生成内(nèi)容,甚至能够创造出独立价(jià)值和独立视角的(de)内容。AIGC的再次(cì)出圈,更代表着(zhe)未来的先进生产(chǎn)力即(jí)将到来。

ChatGPT之(zhī)后(hòu)又一应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑(hēi)料正能量

04

紧抓大(dà)模型与算(suàn)力(lì),牢(láo)固AIGC底座

从技术的发展也(yě)可以(yǐ)看出,在(zài)语言大模(mó)型、图(tú)像大模(mó)型之后,多模态大模型已经成(chéng)为了新的趋势(shì)。

大(dà)模型被(bèi)誉为当前人工智能发展的智能底(dǐ)座,是全(quán)球竞争最激烈(liè)的(de)研究方向之一(yī),包括(kuò)谷歌、亚马(mǎ)逊、百度、阿里、腾讯等众多(duō)头部企业(yè)都(dōu)在竞(jìng)相发力。

不过训(xùn)练大模型的确价格不菲,以国盛(shèng)证券(quàn)发布的《ChatGPT需要多少算(suàn)力》报告(gào)估算,GPT-3训练(liàn)一次(cì)的成本约(yuē)为140万美元(yuán)。而对于一些更(gèng)大(dà)的LLM(大型语言模型),训(xùn)练成本则(zé)介于200万美元(yuán)至1200万美元高价(jià)之间(jiān)。

以ChatGPT在2023年1月的独立访客(kè)平均数1300万计算(suàn),其(qí)对应芯片需求为3万多片英伟达A100 GPU,初始(shǐ)投入成本(běn)约为8亿美元(yuán),每日仅电费就在5万美元左(zuǒ)右。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技行(xíng)业?_黑(hēi)料正(zhèng)能量

此外不论(lùn)是ChatGPT还是AIGC,都离(lí)不开(kāi)庞大算力支持。在关注各(gè)类大模型的(de)发展同时,更应该关注算力网络的建(jiàn)设(shè)。

算(suàn)力(lì)网络正驱动AI产业发展进入(rù)史诗级加(jiā)速进(jìn)程,让AIGC及通用AI这一人工智能发展的终极目标离得更近。

因为算力可以对突破性技(jì)术创新提(tí)供大力的支持。这方面,多模态(tài)大模型是典型。作为面向未来强人工(gōng)智能、通用人工(gōng)智(zhì)能的重要技术创新,多模态(tài)大模型已经在人工(gōng)智能领域提出了(le)很多年(nián),业界(jiè)也有不少技术突破,但(dàn)是(shì),多模态大模型进一步往下走,算力(lì)需求呈几何式(shì)上升,一(yī)般的算力基础设施很(hěn)快将(jiāng)难(nán)以胜任。

从图像、文字(zì)、语音(yīn)单独一项的训练,到双模态、三(sān)模态的(de)跃迁(qiān),让人工智能可(kě)以灵活应对不同模态的转(zhuǎn)化、像人与世界交互一样自然,这方面,由算力网络来驱(qū)动将有(yǒu)明显(xiǎn)优势(shì)。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能量

此(cǐ)外,还有很多需(xū)要爆(bào)发式增长的算力来支撑的(de)技术创新,将(jiāng)在(zài)人工智能算力网络支撑下快速(sù)推进。

AIGC已经(jīng)露出曙光,期待在大(dà)模型和(hé)大算力的支持(chí)下AIGC能持(chí)续颠覆内容(róng)生产的方式,将创造的(de)边际(jì)成本(běn)降(jiàng)低,让万众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 鱼目混珠这个故事,鱼目混珠的典故

评论

5+2=