橘子百科-橘子都知道橘子百科-橘子都知道

发奋还是发愤读书啊,发奋还是发愤图强

发奋还是发愤读书啊,发奋还是发愤图强 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊(liáo)天(tiān)机器人ChatGPT火爆以来,微软(ruǎn)公司创始(shǐ)人比尔·盖茨已多次公开谈论(lùn)人工智(zhì)能话题(tí)。在最近的一次(cì)采访(fǎng)中(zhōng),他再次表示(shì):“AI可(kě)能会让(ràng)科技行业(yè)迎来一(yī)次剧烈的洗牌”。

这个结论是他(tā)在当地时(shí)间2月20日接受《In Good Company》节(jié)目专访(fǎng)时提(tí)出的。

他预(yù)期,AI的发展可能会威(wēi)胁到谷歌的市占率,因为微(wēi)软(ruǎn)在AI方面(miàn)的行动相当迅速。而最终科技巨(jù)头(tóu)将把AI整合成用户的(de)“全能助手(shǒu)”,包揽一切应用,与人们进行(xíng)沟通(tōng)并(bìng)提供建议,可以取代(dài)亚马逊、Siri或Outlook等应用(yòng)。

大佬口中全能助手(shǒu)的到来可能(néng)尚需时(shí)日,但由ControlNet引发(fā)的又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题热(rè)点包围(wéi)中杀出发奋还是发愤读书啊,发奋还是发愤图强重围。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进(jìn)入可控(kòng)期,将洗牌(pái)科(kē)技(jì)行(xíng)业?_黑料正能量

01

ControlNet颠覆AI绘画(huà)新玩(wán)法(fǎ)

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆(bào)火的时候,还是(shì)2022年8月,在美国科罗拉(lā)多州举办的(de)新(xīn)兴数字艺术(shù)家竞赛(sài)中,一幅名为《太空歌剧院》的(de)作品获奖。

随后各大厂商的(de)AI绘画软件被广大网友熟(shú)知(zhī)并体验(yàn),Stable Diffusion便是其中代表。

ChatGPT之(zhī)后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技行业(yè)?_黑料正(zhèng)能(néng)量

用(yòng)户们可(kě)以在应用中输入一组关(guān)键(jiàn)词(cí)或(huò)者一(yī)张照(zhào)片,就(jiù)能获得一(yī)幅AI创作的画作。

作画的关键就是所(suǒ)输入的(de)文本。同一组关键词(cí)也可(kě)以创作出很多张(zhāng)风格(gé)不(bù)一样的(de)画(huà)作,这让创作的(de)过程(chéng)就像开盲盒。

很多用户很喜欢这种(zhǒng)不(bù)确定的惊喜(xǐ),他们会(huì)将生成的美图当做头(tóu)像(xiàng)。而另一部分喜(xǐ)欢翻看AI绘画的“翻车”作品。在社交(jiāo)媒体(tǐ)上,许(xǔ)多用(yòng)户(hù)分(fēn)享AI“翻车现场”,例如,一(yī)位(wèi)网友(yǒu)的(de)小(xiǎo)狗照片被AI画成了“肌(jī)肉男(nán)”,还有(yǒu)网友的(de)个人(rén)照片被AI识别成了(le)建(jiàn)筑(zhù)。

而(ér)如今随着ControlNet的出现(xiàn)与加持,以往AI绘(huì)画的填写关键词游戏可能要(yào)被颠覆了(le)。

ChatGPT之后(hòu)又一(yī)应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能量

ControlNet是一位正(zhèng)在(zài)斯坦福(fú)读(dú)博的中国(guó)人(rén)张吕敏(mǐn)创作的一种(zhǒng)基于控制(zhì)点的图像变形(xíng)算法,主(zhǔ)要用于数字图像处理、计算机视觉和计算机(jī)图形学等领(lǐng)域(yù)。

其SD插件一经(jīng)发布,在短短的两天内便成(chéng)为(wèi)了AI绘画(huà)领域最新的热点。

在此之(zhī)前,大家用了很多方(fāng)法(fǎ)想让AI生(shēng)成的结果尽可(kě)能的符合(hé)要求,但是都不尽(jǐn)如人意,它的出现代表(biǎo)着AI生成(chéng)开始进(jìn)入真正(zhèng)的可控时期。

因为ControlNet可以直接提取画(huà)面(miàn)的(de)构图,人物的(de)姿势(shì)和画面的深度信息等。有了(le)它的帮助,就不用频(pín)繁(fán)的用提示词来碰运(yùn)气,抽(chōu)盲盒式的创(chuàng)作(zuò)了。

通俗的说ControlNet相(xiāng)当于给(gěi)AI绘画(huà)加了“魔(mó)法”,不少博主的作品已经获得(dé)了大量的浏览(lǎn)量,“viggo”就(jiù)是其中之(zhī)一,他(tā)用朋友(yǒu)的照片(piàn)直接带(dài)她们走进动漫世界(jiè)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技(jì)行(xíng)业?_黑料正能量

viggo先(xiān)用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展找到对(duì)应(yīng)的关键词;最(zuì)后用ControlNet插件绑定骨骼(gé)开始换关键词试效果。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入(rù)可控期,将洗牌科技行业(yè)?_黑料(liào)正能量

通过图片就可以看出来,效果十分惊艳(yàn)。

ChatGPT之(zhī)后(hòu)又一(yī)应用杀疯了,AIGC或(huò)进入可控期,将洗牌(pái)科技行业?_黑(hēi)料正能量

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入(rù)可控(kòng)期,将(jiāng)洗牌科技行(xíng)业?_黑料(liào)正能量

更厉害的(de)是,除了(le)真实的照片,草(cǎo)图也(yě)可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍到(dào)ControlNet还能实(shí)现线稿(gǎo)转全彩图。大(dà)神张吕敏(mǐn)其(qí)本尊(zūn)也亲自(zì)回应。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进(jìn)入可(kě)控(kòng)期(qī),将洗牌科技(jì)行业?_黑料正能量

不得不说(shuō)当下AIGC已经(jīng)变得越来越(yuè)强大(dà),甚至输出的(de)作(zuò)品都已经能以(yǐ)假乱真了。

02

难辨虚实,AIGC技术力(lì)爆发

警(jǐng)惕安全(quán)问题(tí)

近(jìn)日,“苏州金鸡湖有游(yóu)艇party”的消息火遍网络,而经过(guò)警方(fāng)辟(pì)谣(yáo)这(zhè)所谓的“party”可能是全国第一起AI绘图诈骗。

由于这(zhè)个(gè)活(huó)动里面(miàn)给出的(de)美(měi)女照片都是AI制作的真人照(zhào)片绘图,因为太逼真,被大(dà)家(jiā)当成真事传播了

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

不过仔细观察可以发(fā)现,活动(dòng)发起者提供的(de)照片中有(yǒu)个(gè)很大的漏洞可以发现并非真人,而(ér)是(shì)AI绘图(tú),那便是图片中女性的手指(zhǐ)部分有的(de)存在异(yì)常。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业(yè)?_黑料正能量

有(yǒu)行业人(rén)事表示(shì):“现在(zài)因为手指部分的(de)绘(huì)画算法比较复杂,AI还不(bù)太会(huì)画(huà)人的(de)手,但最新看到(dào)的图片已经(jīng)有越来越完美(měi)的AI模型出现(xiàn),以(yǐ)后可(kě)能就(jiù)完(wán)全没有(yǒu)漏洞了。

类似的AI作图(tú)诈骗(piàn)在国外也(yě)已有发生。据英国广播(bō)公(gōng)司报道,土(tǔ)耳其地震期间,有Tiktok用户使(shǐ)用AI合(hé)成了(le)儿童受(shòu)灾的假照片(piàn)发(fā)布到网络,以此诱骗善(shàn)良的人打赏“捐助(zhù)”从(cóng)而实施诈骗。

目前随(suí)着技术发展(zhǎn),AIGC已经能做出真(zhēn)人照片般(bān)的绘图效果(guǒ),如果这样的图片被(bèi)用(yòng)来诈骗,将非常(cháng)可怕。

此外AIGC还引(yǐn)发了很(hěn)多担忧(yōu),一方面,批(pī)判者认为AI在“学(xué)习”了(le)大量前(qián)人(rén)的作品之后,其创作没有任何情(qíng)绪(xù)和灵(líng)魂,难以(yǐ)和人类的艺术创作相提(tí)并(bìng)论。

另一方面(miàn),AIGC背(bèi)后的版权、目前(qián)都(dōu)并(bìng)没有得到有效的(de)解决(jué),还有AIGC会(huì)不会代替人类“至高(gāo)无(wú)上”的创意。

马斯克也强调,人(rén)工智能的(de)安全问题需要(yào)得到重视,太晚就来(lái)不及了。

03

AIGC下一站(zhàn)除了(le)视(shì)频,还有远(yuǎn)方(fāng)

技术都(dōu)是有两(liǎng)面性的,潜在的危害(hài)并不(bù)能掩盖(gài)其光(guāng)辉的(de)贡献。现(xiàn)在看来,人工智能技术将是第四次工业革命(mìng)的核(hé)心驱动力量,将创造新(xīn)的增长(zhǎng)奇迹(jì)。

过去(qù)一年,人工智能在技术和商业层面都有了巨大进展,AI绘画(huà)就(jiù)是人工智能技术发生方向性改变的(de)一个代表(biǎo)。其下一(yī)站或(huò)许就(jiù)是视频。

此前,Meta和(hé)谷歌先后发布了(le)几条引爆科(kē)技(jì)圈的(de)短(duǎn)视频。这(zhè)些视频引(yǐn)发关注并(bìng)非内容(róng)做得多优(yōu)秀,反而都非常简单(dān),比如一匹正在喝水(shuǐ)的马,一只画(huà)画的玩具(jù)熊,或者一段骑摩托(tuō)车的第一视角录像,随便(biàn)一(yī)个(gè)有手(shǒu)机的人都可(kě)以随(suí)手录下一段。

ChatGPT之后又一应用杀疯了(le),AIGC或进入(rù)可控期,将洗(xǐ)牌科(kē)技行(xíng)业(yè)?_黑料正能量

但(dàn)这些短视频的创(chuàng)作方式非常简单,创作(zuò)者仅仅需要向AI输(shū)入一段话(huà),甚至只(zhǐ)是说(shuō)一下要求,AI就(jiù)可以根据需要(yào)生成(chéng)一(yī)段视频(pín)。

谷歌发布的两个AI生成视(shì)频分别(bié)来自于Imagen Video和Phenaki,前者主要突出的是高(gāo)清,与Meta的Make-A-Video没有太(tài)多的(de)差别(bié)。

在Make-A-Video公(gōng)布了AI生成的(de)视频后,AI圈(quān)就已经(jīng)玩了一波梗,一个能够做出更高清视频(pín)的AI还不足以在(zài)短(duǎn)时间内戳中(zhōng)兴奋点。

Phenaki更加(jiā)令人(rén)震惊的(de)地方在于,它(tā)可以制作出超过2分钟的连贯的也有(yǒu)确切内容(róng)的视频,这才是真正让人们感到惊喜的地方(fāng)。因为(wèi)无论AI生(shēng)成的视频多么(me)高清,也只(zhǐ)能是为内容生产者提供一个灵感,一个素材,一(yī)个过场动画(huà)。

不过能(néng)够(gòu)制作出有具体剧情内容的视频(pín)就意味(wèi)着,一些视频创作(zuò)由(yóu)AI代替人工完成已经初步有了可(kě)能。

当下AI的发(fā)展(zhǎn)速(sù)度已经(jīng)超过大(dà)部(bù)分人的(de)想象。内容产业的(de)本(běn)质是供(gōng)给创(chuàng)造需求,AIGC作为(wèi)全(quán)新的内容生产方式,可(kě)以为内容产业(yè)带(dài)来更新的内容风(fēng)格、更快的生产速度,更低的生产(chǎn)成本,这无疑(yí)会驱动内容产业的大(dà)爆(bào)发。

除(chú)了AI绘(huì)图、视频,AIGC技术还能应用于音乐、代码、机器人动作等多(duō)种内容形式的生成。不难发现该项(xiàng)技术不仅在游戏等行(xíng)业能(néng)得到有效应用,对于下一代互联网各种元素的构建亦(yì)有关键意义。

从商业化的角度来看(kàn),文化娱乐、教育、传媒(méi)等(děng)诸(zhū)多领域,本身(shēn)就对(duì)基(jī)于AI的可视化内容有(yǒu)强烈(liè)需求。

因此,AI绘画(huà)及(jí)视频或不是结(jié)果(guǒ),而只是(shì)AI进程(chéng)中的一块重要拼图(tú),有(yǒu)望在技(jì)术更新的加持下实现更大的应用价值。

AI从理(lǐ)解内(nèi)容(róng),走向(xiàng)了可以生成内容,甚至能够创(chuàng)造出独立价值和独立视角的内(nèi)容(róng)。AIGC的再(zài)次出(chū)圈,更代表(biǎo)着未(wèi)来的先(xiān)进生(shēng)产力即将到来(lái)。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技(jì)行(xíng)业?_黑(hēi)料正能量

04

紧(jǐn)抓大模型(xíng)与算力,牢固(gù)AIGC底座

从技(jì)术的(de)发(fā)展也可以看(kàn)出,在(zài)语言大模型、图像大模型之后(hòu),多模态大(dà)模(mó)型已经成为了新(xīn)的趋势。

大模型被誉为当前人工智能(néng)发展的智能(néng)底座,是全球竞(jìng)争(zhēng)最激(jī)烈的研究方(fāng)向之一(yī),包括谷(gǔ)歌、亚马逊、百度、阿里、腾讯等众多(duō)头部企业都在(zài)竞相发力。

不过训练大(dà)模型的确价格不菲(fēi),以国(guó)盛证(zhèng)券发布的《ChatGPT需要多少算力》报(bào)告(gào)估算,GPT-3训练一次(cì)的成本约为140万美元。而对于一些(xiē)更大的LLM(大型语言模型(xíng)),训(xùn)练成本则(zé)介于200万美(měi)元至1200万美(měi)元高价之间。

以ChatGPT在(zài)2023年1月的独(dú)立访客平均数(shù)1300万(wàn)计算,其对(duì)应(yīng)芯片需求为(wèi)3万多片(piàn)英(yīng)伟达A100 GPU,初始投入成(chéng)本约为8亿(yì)美元(yuán),每日仅(jǐn)电费就在5万(wàn)美(měi)元左右。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑料正(zhèng)能(néng)量

此外不(bù)论是ChatGPT还是AIGC,都离不开庞(páng)大算力支持。在关注(zhù)各(gè)类大模型的发展(zhǎn)同(tóng)时,更应该关注算力网络的建设。

算力网络正驱(qū)动AI产业(yè)发展进(jìn)入史诗级(jí)加速进(jìn)程,让AIGC及(jí)通用AI这一人工智能(néng)发展的终(zhōng)极目标离(lí)得更近。

因(yīn)为算力可(kě)以对突(tū)破性技(jì)术创新(xīn)提供大力的(de)支持。这(zhè)方面,多模(mó)态大模型是典型。作为面向未(wèi)来强(qiáng)人工(gōng)智能、通用人工智能的重要技术创新,多模(mó)态大模型已经在(zài)人(rén)工智能领域提出了(le)很多(duō)年,业界也有不少技术突破,但是(shì),多模态大模型进一(yī)步往(wǎng)下走,算力需求呈几何式上升,一(yī)般(bān)的算(suàn)力基础设(shè)施(shī)很(hěn)快将难以胜任。

从图像、文字、语音(yīn)单独一项的训练,到双模态、三(sān)模态的跃迁(qiān),让(ràng)人(rén)工智能可以灵活应对(duì)不同模态的转化(huà)、像人与(yǔ)世界交(jiāo)互一样自然(rán),这方面,由算(suàn)力网络来(lái)驱动将有明显优势。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入(rù)可控期(qī),将(jiāng)洗牌科(kē)技行业?_黑料正能量

此外,还有很(hěn)多需要爆发式增长的算力来支撑的技术创(chuàng)新,将在人工(gōng)智(zhì)能算(suàn)力网络支撑下快速推进。

AIGC已经露(lù)出(chū)曙(shǔ)光,期待在大模型和大(dà)算力的(de)支(zhī)持下AIGC能(néng)持续颠覆内(nèi)容(róng)生产的方式,将(jiāng)创(chuàng)造的边(biān)际成本降低(dī),让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 发奋还是发愤读书啊,发奋还是发愤图强

评论

5+2=