橘子百科-橘子都知道橘子百科-橘子都知道

马美如简介

马美如简介 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器(qì)人ChatGPT火爆以来(lái),微软公司创始(shǐ)人比尔(ěr)·盖茨已多次公开谈论人工智(zhì)能话题(tí)。在最近的一次采访中,他再次表示:“AI可能会让(ràng)科技行(xíng)业(yè)迎(yíng)来一(yī)次剧(jù)烈(liè)的洗牌”。

这个结论是他在当地时间2月20日接(jiē)受(shòu)《In Good Company》节目(mù)专访时提出(chū)的。

他(tā)预期,AI的发展可能会(huì)威胁到谷歌(gē)的市占率,因为微软在AI方面的行动相当迅(xùn)速。而最(zuì)终科技巨(jù)头将把(bǎ)AI整合成(chéng)用户的“全能(néng)助手”,包揽一切应用,与人们进(jìn)行沟(gōu)通并提供建(jiàn)议,可以(yǐ)取代(dài)亚(yà)马逊、Siri或Outlook等应用。

大佬口中全能助手(shǒu)的(de)到来可能尚(shàng)需时日,但由ControlNet引发的又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题热点包围中杀出重围。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期(qī),将洗(xǐ)牌(pái)科技(jì)行(xíng)业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为(wèi)代表的AIGC上(shàng)一次爆火(huǒ)的时候,还是2022年8月,在美国(guó)科罗拉多州举办(bàn)的新(xīn)兴数字(zì)艺术(shù)家竞赛中(zhōng),一幅名为《太空(kōng)歌(gē)剧院(yuàn)》的作(zuò)品获(huò)奖。

随后各大厂商的AI绘画软件被(bèi)广大网友熟知并体验(yàn),Stable Diffusion便(biàn)是其中(zhōng)代表。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗牌(pái)科技行业?_黑(hēi)料正能量

用户们可以在(zài)应(yīng)用中输入一组(zǔ)关键词或者一张(zhāng)照片,就能获得一幅(fú)AI创作(zuò)的画(huà)作。

作画的(de)关键就是所输入(rù)的文本。同一组关键词也可(kě)以(yǐ)创作出很(hěn)多张风格不一样的(de)画(huà)作,这让创作的(de)过(guò)程就像开盲(máng)盒(hé)。

很多用户(hù)很喜欢(huān)这种不确定的惊喜,他们会将生成的美(měi)图当做头像。而另一部分(fēn)喜欢翻看AI绘画的“翻车”作品。在社交媒体上,许多用户分享(xiǎng)AI“翻车(chē)现场”,例如,一位网友(yǒu)的小(xiǎo)狗照片被AI画成了“肌肉男”,还有(yǒu)网友(yǒu)的个人照(zhào)片(piàn)被AI识别成了建(jiàn)筑。

而如今随着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可(kě)能要被(bèi)颠覆了。

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀疯了(le),AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

ControlNet是一位正在斯坦福读博的中国人(rén)张吕敏(mǐn)创作的一种基于控制点的(de)图像(xiàng)变(biàn)形算法,主要用于数(shù)字(zì)图像(xiàng)处理、计算机视觉和计(jì)算(suàn)机(jī)图(tú)形学等领域。

其SD插件一经(jīng)发布,在短短的(de)两天内(nèi)便成(chéng)为了AI绘(huì)画领域(yù)最新(xīn)的热点。

在此之(zhī)前,大家用了很(hěn)多方法想(xiǎng)让AI生成的结果尽(jǐn)可能的(de)符合(hé)要求,但是都(dōu)不尽如人意(yì),它的出现代表着(zhe)AI生成开始进(jìn)入(rù)真正的可控(kòng)时期。

因(yīn)为ControlNet可以直接提取(qǔ)画(huà)面(miàn)的构图,人物的姿势和画面(miàn)的(de)深度信息等。有了它(tā)的帮助,就不用(yòng)频繁(fán)的(de)用提(tí)示词来碰运气,抽盲盒(hé)式(shì)的创作(zuò)了(le)。

通(tōng)俗的说ControlNet相当(dāng)于(yú)给AI绘画加(jiā)了“魔法(fǎ)”,不少博主(zhǔ)的作(zuò)品已(yǐ)经获得了大量的浏(liú)览量(liàng),“viggo”就是其中之(zhī)一,他用(yòng)朋(péng)友的照片(piàn)直接带她们走进动漫世界(jiè)。

ChatGPT之(zhī)后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科(kē)技行业?_黑(hēi)料正能(néng)量

viggo先用StableDiffusion图片(piàn)转文字。

再用Text2Prompt插件(jiàn)拓展(zhǎn)找到对应(yīng)的关键词(cí);最(zuì)后用(yòng)ControlNet插件绑定骨(gǔ)骼(gé)开始换关键词试(shì)效果。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科(kē)技行(xíng)业?_黑料正能量

通过(guò)图片就可(kě)以(yǐ)看出(chū)来(lái),效果十分惊艳(yàn)。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进入(rù)可控期,将(jiāng)洗牌科(kē)技(jì)行业?_黑料正能(néng)量

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

更(gèng)厉(lì)害的是,除了真(zhēn)实(shí)的(de)照片,草图也(yě)可以加上“魔(mó)法”,知(zhī)乎大牛“DevPoint”和“逗(dòu)砂(shā)”介(jiè)绍到ControlNet还能(néng)实现线稿转全彩图(tú)。大(dà)神(shén)张吕(lǚ)敏(mǐn)其本尊也亲自回应。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

不得不(bù)说当下AIGC已经变得越来越强大(dà),甚至(zhì)输出(chū)的作(zuò)品(pǐn)都(dōu)已经(jīng)能以(yǐ)假乱(luàn)真了。

02

难辨虚实,AIGC技术力爆发(fā)

警惕安(ān)全问题(tí)

近(jìn)日,“苏州金鸡湖有游艇(tǐng)party”的消息火遍网络,而(ér)经过警方辟(pì)谣这所谓的“party”可能是全国第一起AI绘(huì)图(tú)诈(zhà)骗(piàn)。

由(yóu)于这个活动里面给出的美(měi)女照片都(dōu)是AI制(zhì)作的真人照(zhào)片绘图,因(yīn)为太逼真,被大(dà)家当(dāng)成真事(shì)传播了(le)

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌(pái)科技行业?_黑料(liào)正(zhèng)能(néng)量

不(bù)过仔细观察(chá)可以发现,活(huó)动(dòng)发起者提(tí)供的(de)照(zhào)片中(zhōng)有个很大(dà)的漏洞可以发现并非真人,而是AI绘图(tú),那便是图片中女性的手指(zhǐ)部分有的存在异(yì)常。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技(jì)行业(yè)?_黑料正(zhèng)能量

有行业人事表示:“现在因为(wèi)手指部分的(de)绘(huì)画算法比较(jiào)复杂,AI还不太(tài)会画人的手(shǒu),但最新看到(dào)的图(tú)片已经有(yǒu)越来越完美的AI模型出现,以后可能就完全(quán)没(méi)有漏洞了(le)。

类似的AI作图(tú)诈骗在国外也(yě)已(yǐ)有发生。据英国(guó)广(guǎng)播公司报道,土耳其(qí)地(dì)震(zhèn)期间,有(yǒu)Tiktok用户使用(yòng)AI合成了儿童受灾的假照片发布到网络,以此(cǐ)诱骗善良的人(rén)打(dǎ)赏“捐助”从而实施诈骗(piàn)。

目前(qián)随着技术发展,AIGC已经能做出真(zhēn)人(rén)照(zhào)片(piàn)般的绘图效果(guǒ),如果这样的图片被用来诈骗(piàn),将非常可怕。

此(cǐ)外AIGC还引发了很多担忧,一方面,批判者认为AI在(zài)“学习(xí)”了(le)大(dà)量前人的作品之后(hòu),其创作(zuò)没(méi)有(yǒu)任何情绪和灵魂,难以(yǐ)和人类的艺(yì)术(shù)创作(zuò)相提并论。

另一方(fāng)面(miàn),AIGC背后(hòu)的版权、目(mù)前都并没有(yǒu)得到有(yǒu)效的(de)解决,还有AIGC会(huì)不会(huì)代替人类(lèi)“至高无上”的创意。

马斯克(kè)也强(qiáng)调(diào),人工(gōng)智能(néng)的安全(quá马美如简介n)问题需要得到重视,太(tài)晚就(jiù)来(lái)不及(jí)了(le)。

03

AIGC下一站除了视频(pín),还有远方(fāng)

技(jì)术都(dōu)是(shì)有两面性的,潜在的(de)危(wēi)害并不能(néng)掩盖其光辉(huī)的贡献。现(xiàn)在看(kàn)来,人工智(zhì)能技术将是第四次工(gōng)业革命的核(hé)心驱动力(lì)量,将创造新的增长奇迹。

过(guò)去(qù)一年,人工(gōng)智(zhì)能在技术和商业层面都(dōu)有了巨(jù)大进展(zhǎn),AI绘画就是人工智能技术发生(shēng)方向性改变的一个(gè)代表。其下一站或许(xǔ)就是视(shì)频(pín)。

此前,Meta和谷歌先后(hòu)发布了几条引(yǐn)爆科技(jì)圈(quān)的短视频。这些视频引(yǐn)发关(guān)注并非内容做得多优(yōu)秀,反(fǎn)而都非常简(jiǎn)单,比(bǐ)如一匹正(zhèng)在喝水的(de)马,一只画画的(de)玩具熊(xióng),或者一段骑摩托车的(de)第(dì)一(yī)视(shì)角录(lù)像(xiàng),随(suí)便一(yī)个有手机的人都可以随手(shǒu)录下一段。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌(pái)科(kē)技行业?_黑料正能量

但这(zhè)些短视频的创(chuàng)作方式非常简单,创作者(zhě)仅仅需(xū)要向(xiàng)AI输(shū)入一段(duàn)话,甚至只是(shì)说一下要求,AI就可(kě)以(yǐ)根据需要(yào)生成一段(duàn)视频。

谷歌发布的两个AI生成视(shì)频分别来自于Imagen Video和(hé)Phenaki,前者主要突出(chū)的是高清(qīng),与(yǔ)Meta的Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布了AI生成的视频后,AI圈就已(yǐ)经玩了一波(bō)梗,一个能(néng)够做出更高清视频的AI还(hái)不(bù)足以在短时间(jiān)内戳中兴(xīng)奋点。

Phenaki更加令(lìng)人震惊的地方(fāng)在于,它可以制作出超过2分钟的连(lián)贯的也有确切内(nèi)容的视频,这才是真正让人们感到惊喜的地方。因为无(wú)论(lùn)AI生成的视频多么高清,也只能是为内(nèi)容(róng)生产者提(tí)供一个(gè)灵感(gǎn),一个素材(cái),一个过场动画。

不(bù)过能够制作(zuò)出有具(jù)体剧情内容的视频(pín)就(jiù)意(yì)味着,一些视频(pín)创(chuàng)作由AI代替人(rén)工完成已经初步有了可能。

当下AI的(de)发展速度已经(jīng)超过(guò)大部分人(rén)的(de)想象(xiàng)。内容产(chǎn)业(yè)的本质(zhì)是供给创造需求(qiú),AIGC作为(wèi)全新的内容(róng)生产方式,可以为(wèi)内容产业带来更新(xīn)的内容风格(gé)、更(gèng)快的生产速度,更低的生产成本(běn),这无疑会驱(qū)动内(nèi)容产(chǎn)业(yè)的(de)大爆发。

除了AI绘图、视频(pín),AIGC技术还能应(yīng)用(yòng)于(yú)音乐、代码、机器人(rén)动作等多种内(nèi)容形式的(de)生成。不难发现该项技术(shù)不仅(jǐn)在游戏等行(xíng)业能(néng)得到(dào)有效应(yīng)用,对于下(xià)一代(dà马美如简介i)互联网各种(zhǒng)元素的构建亦有关键意义。

从商业化(huà)的角度来看(kàn),文(wén)化娱(yú)乐(lè)、教育(yù)、传媒等诸(zhū)多领(lǐng)域,本身(shēn)就(jiù)对基(jī)于(yú)AI的可视化内(nèi)容有(yǒu)强(qiáng)烈(liè)需求。

因(yīn)此,AI绘画(huà)及视频或不是结果,而(ér)只是AI进(jìn)程中的一块重要拼(pīn)图(tú),有望在(zài)技(jì)术更新的加持下实现更(gèng)大的应用(yòng)价(jià)值。

AI从理解内容,走向了可(kě)以生(shēng)成内容(róng),甚至(zhì)能(néng)够创造(zào)出独(dú)立价(jià)值和独(dú)立视角的内容。AIGC的再次出圈(quān),更(gèng)代(dài)表着未来的(de)先进生产(chǎn)力即(jí)将到来。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期(qī),将洗牌科技行业?_黑料正能量

04

紧抓大(dà)模型与算力,牢固AIGC底座

从技术的发展也可以看出,在语言大模(mó)型、图像(xiàng)大模型(xíng)之(zhī)后,多模态大模型已经成为了新的趋势(shì)。

大模型被(bèi)誉(yù)为当前人(rén)工智(zhì)能发(fā)展的智能底座,是(shì)全球竞争最(zuì)激烈的研(yán)究方向(xiàng)之(zhī)一,包括谷歌、亚马逊、百度、阿(ā)里(lǐ)、腾讯等众多头部(bù)企业都在竞相发(fā)力(lì)。

不过(guò)训练大模(mó)型的确价格(gé)不(bù)菲,以国盛(shèng)证券发(fā)布的《ChatGPT需(xū)要多少算力》报告估算,GPT-3训练一次的(de)成本(běn)约为140万(wàn)美元。而对于一些更大的LLM(大型语言模型),训练成本(běn)则介于200万美元至1200万美(měi)元高价之间(jiān)。

以ChatGPT在(zài)2023年1月的独立(lì)访(fǎng)客平均数1300万计算,其(qí)对(duì)应芯片需求(qiú)为3万多(duō)片英伟达A100 GPU,初始投(tóu)入成本(běn)约为8亿美(měi)元(yuán),每日仅电(diàn)费(fèi)就(jiù)在5万美元左右(yòu)。

ChatGPT之后又(yòu)一应(yīng)用杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量(liàng)

此外不论是(shì)ChatGPT还是AIGC,都离不开庞(páng)大(dà)算力支持。在关注各类大模(mó)型的(de)发展同时(shí),更应(yīng)该(gāi)关(guān)注算力(lì)网(wǎng)络的建设。

算力网络正驱(qū)动(dòng)AI产(chǎn)业发展进入史诗级加速进程,让(ràng)AIGC及通用AI这一人工(gōng)智能发展的终极(jí)目标离得更近(jìn)。

因为算力可以(yǐ)对突(tū)破(pò)性技术创新提供大(dà)力的(de)支(zhī)持。这(zhè)方面,多(duō)模态大模型是典型。作(zuò)为面向未来(lái)强人工智能、通用(yòng)人工智能的重要技术创新,多模态大模型已经在人工智能领(lǐng)域提(tí)出了很多(duō)年,业界(jiè)也有不少技术突破,但(dàn)是,多模态(tài)大模型进一步往(wǎng)下走,算力需求呈几何式上(shàng)升,一(yī)般(bān)的算力基础设(shè)施(shī)很快将难以胜任。

从图像、文字、语音单独一项的(de)训练,到双模态、三(sān)模(mó)态(tài)的(de)跃迁(qiān),让人工智(zhì)能可以灵活应对不(bù)同模态(tài)的转化、像人与世(shì)界交互一(yī)样自(zì)然,这方面,由算力网络来驱(qū)动将有明显(xiǎn)优势。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗牌科(kē)技行(xíng)业?_黑料正(zhèng)能量

此外,还有很多需要爆(bào)发式增长的算力来(lái)支撑的技术创(chuàng)新(xīn),将在人工(gōng)智能算力网络(luò)支撑(chēng)下快速(sù)推进(jìn)。

AIGC已(yǐ)经露出曙光(guāng),期待(dài)在大模型和大算力的支(zhī)持下AIGC能持续颠覆(fù)内(nèi)容生产的方式,将创造(zào)的边际成本降低(dī),让万众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 马美如简介

评论

5+2=