橘子百科-橘子都知道橘子百科-橘子都知道

领略的意思

领略的意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天(tiān)机器人ChatGPT火爆以来,微(wēi)软公(gōng)司创始(shǐ)人(rén)比(bǐ)尔(ěr)·盖茨已(yǐ)多次公开(kāi)谈论人工智能话(huà)题(tí)。在(zài)最近(jìn)的一次采访中,他再次(cì)表(biǎo)示:“AI可能会让科技(jì)行业迎来一(yī)次剧烈(liè)的洗牌”。

这个结论(lùn)是他在当地时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预(yù)期,AI的发展可(kě)能会威胁到(dào)谷歌的市占(zhàn)率,因为微(wēi)软在AI方面的行动相当迅速。而最终科技巨头(tóu)将把AI整合(hé)成用(yòng)户(hù)的“全能助(zhù)手”,包(bāo)揽一(yī)切应(yīng)用,与(yǔ)人(rén)们进(jìn)行沟通并提供建议,可(kě)以取代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能(néng)助手的到来可(kě)能尚(shàng)需时日,但由ControlNet引发的又一次AI绘画浪潮(cháo),让AIGC在ChatGPT的话(huà)题热点包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正(zhèng)能(néng)量(liàng)

01

ControlNet颠覆(fù)AI绘(huì)画新(xīn)玩法

AIGC向可控靠(kào)近

以AI绘画为(wèi)代(dài)表的AIGC上一次(cì)爆火的时候(hòu),还是2022年8月(yuè),在美国科(kē)罗拉多州(zhōu)举办的新兴数字艺术家竞赛(sài)中,一幅名为《太空歌(gē)剧院》的作品获奖。

随后(hòu)各大厂(chǎng)商(shāng)的AI绘画软件被广(guǎng)大网(wǎng)友(yǒu)熟知并(bìng)体(tǐ)验,Stable Diffusion便是其中代表(biǎo)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控(kòng)期,将(jiāng)洗牌(pái)科技(jì)行业?_黑料正(zhèng)能量

用户(hù)们可以在应用(yòng)中输入一组关(guān)键词或者一张照片,就(jiù)能获得一幅AI创(chuàng)作的画作。

作画的关键就是所输入的文本。同一组关键词也可以创作出很多(duō)张风格(gé)不一样的画作,这让创作(zuò)的过程(chéng)就像开(kāi)盲盒。

很多(duō)用户很喜欢这种(zhǒng)不确(què)定的惊喜,他们会将(jiāng)生(shēng)成的美图当做头(tóu)像(xiàng)。而另一部(bù)分喜欢翻(fān)看AI绘画的(de)“翻车”作品。在(zài)社交媒(méi)体上,许多用户分(fēn)享AI“翻车现场(chǎng)”,例如(rú),一位网友的小狗照片被AI画成了“肌肉男”,还有网友的个人照片被AI识别成了建筑。

而如今随着ControlNet的出现(xiàn)与加持,以(yǐ)往AI绘(huì)画的填(tián)写关键词(cí)游戏可能要(yào)被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量领略的意思"https://mmbiz.heiliaofuli.com/wp-content/uploads/2023/03/19d7ab2c0056bd4.jpeg?imageMogr2/thumbnail/2160x0/format/webp/quality/80" data-ratio="1.12109375" data-s="300,640" data-type="jpeg" data-w="1024">

ControlNet是一(yī)位正在斯坦福读博(bó)的中国人(rén)张吕敏(mǐn)创作(zuò)的一种基(jī)于(yú)控制点的图(tú)像变(biàn)形(xíng)算法,主要用于数字图像处理、计算机(jī)视觉(jué)和计算机图形学等(děng)领域(yù)。

其SD插件一经发(fā)布(bù),在短短(duǎn)的两(liǎng)天内便(biàn)成为了AI绘画领(lǐng)域最新的热(rè)点。

在(zài)此之前,大(dà)家用了很多方(fāng)法想让AI生成的结果尽可能的(de)符(fú)合要求,但(dàn)是都不尽(jǐn)如人(rén)意,它的出现代表着AI生成开(kāi)始(shǐ)进入真正的(de)可控时期。

因为ControlNet可以(yǐ)直接提取画面(miàn)的(de)构(gòu)图,人物的姿(zī)势和(hé)画面(miàn)的深度信息等。有了它(tā)的帮助,就不(bù)用频繁的用提示词来碰运气,抽盲(máng)盒(hé)式的创作了(le)。

通俗(sú)的说ControlNet相当于给AI绘画(huà)加了“魔法”,不少博主的作(zuò)品已经(jīng)获得(dé)了大量的浏览量,“viggo”就是其中(zhōng)之一(yī),他(tā)用(yòng)朋友的(de)照片直接带她们走进动漫世界。

ChatGPT之后(hòu)又一应(yīng)用杀疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找到(dào)对应的关键词;最后(hòu)用ControlNet插件绑(bǎng)定(dìng)骨骼开始换关键词(cí)试效果。

ChatGPT之后(hòu)又一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可(kě)控期(qī),将洗(xǐ)牌科技行(xíng)业?_黑料(liào)正(zhèng)能量

通过图片(piàn)就(jiù)可以看出来(lái),效果十分惊艳。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或(huò)进入可控期(qī),将(jiāng)洗牌科技行业?_黑料正能量

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期(qī),将(jiāng)洗(xǐ)牌科技行业?_黑料正能量

更厉害的是,除了真实的照片,草图也可以加上“魔(mó)法”,知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还(hái)能实现线稿转(zhuǎn)全(quán)彩图。大神张(zhāng)吕敏其本尊也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行(xíng)业?_黑料正能量

不(bù)得不说当下AIGC已经变得越来(lái)越强大(dà),甚至输出的作品都(dōu)已经(jīng)能以假乱真了。

02

难(nán)辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州(zhōu)金鸡湖有游艇party”的消息火遍网(wǎng)络(luò),而(ér)经过警方辟谣这所谓的“party”可能是全(quán)国第(dì)一起AI绘图诈骗。

由于这(zhè)个活(huó)动里面给出的美女照片都是AI制作(zuò)的真人照(zhào)片绘(huì)图,因为太(tài)逼真(zhēn),被(bèi)大家当成真事传播(bō)了

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行(xíng)业?_黑(hēi)料正能(néng)量

不过(guò)仔细观(guān)察可以发现,活动发起者提供的照(zhào)片中有个很大的(de)漏洞可以发现(xiàn)并非真人,而是AI绘图,那便是图(tú)片(piàn)中女性的手指部分有(yǒu)的(de)存在异(yì)常(cháng)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌(pái)科技行业?_黑料正(zhèng)能(néng)量

有行(xíng)业人事表示:“现在因(yīn)为手指(zhǐ)部(bù)分的绘画算法比较复杂,AI还不太会(huì)画人的手,但最新看到(dào)的图(tú)片已经有(yǒu)越来越(yuè)完美的AI模型出现,以后(hòu)可(kě)能就完全没有漏洞了。

类似的AI作图诈(zhà)骗(piàn)在国(guó)外(wài)也已(yǐ)有发生(shēng)。据英国广播公(gōng)司报(bào)道,土耳其(qí)地震期间,有Tiktok用(yòng)户使用(yòng)AI合成(chéng)了儿童受灾的(de)假照片发布到网络(luò),以(yǐ)此诱(yòu)骗(piàn)善良的人打赏“捐助”从而实施诈骗。

目前随着技术(shù)发展,AIGC已经能做(zuò)出(chū)真人照(zhào)片般的绘(huì)图效果,如果这样(yàng)的(de)图(tú)片被(bèi)用来诈(zhà)骗,将非常(cháng)可怕。

此外(wài)AIGC还引(yǐn)发了很多担忧,一方面(miàn),批判者(zhě)认为AI在“学习”了大(dà)量(liàng)前(qián)人(rén)的作(zuò)品之后,其创(chuàng)作没有任何情绪和(hé)灵(líng)魂,难以和人类的艺术(shù)创作(zuò)相提并论。

另一(yī)方面,AIGC背后的版权、目前都并(bìng)没有得到有效(xiào)的解决,还有AIGC会不会代替人(rén)类“至高无上(shàng)”的创(chuàng)意。

马斯克(kè)也强调,人工智能(néng)的(de)安全问题需要得到(dào)重视,太晚就(jiù)来不及了。

03

AIGC下一站除(chú)了视频,还有远(yuǎn)方

技术都是有两面性的(de),潜在的危(wēi)害并不能掩盖其光辉的(de)贡献。现(xiàn)在看来,人工智能(néng)技(jì)术将是第四次工业革命的核心驱动(dòng)力量,将创造新的(de)增长(zhǎng)奇迹。

过(guò)去一(yī)年,人(rén)工智能(néng)在技(jì)术和商业(yè)层面都有了巨(jù)大进展,AI绘画就是人工(gōng)智能技术发生方(fāng)向性(xìng)改变的(de)一(yī)个代表。其下一站或(huò)许就是视频。

此(cǐ)前,Meta和谷歌先(xiān)后(hòu)发布了几条(tiáo)引(yǐn)爆(bào)科技圈的(de)短视频。这些视频引发关注并非内容做(zuò)得多优秀(xiù),反(fǎn)而都非常简单,比如一(yī)匹正在喝水的(de)马,一只画画的玩具熊,或者一段(duàn)骑摩托车(chē)的第一视角(jiǎo)录像,随便一个(gè)有手机的人都(dōu)可以随(suí)手录(lù)下一段。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科技(jì)行业?_黑料(liào)正(zhèng)能量

但这些短视频的(de)创作方式非常(cháng)简(jiǎn)单,创作者(zhě)仅仅需要向AI输入一段话(huà),甚至只是(shì)说(shuō)一下要求,AI就可(kě)以根据(jù)需要生成一段视频。

谷歌发布的两个AI生成(chéng)视频分别来自于(yú)领略的意思Imagen Video和Phenaki,前者主(zhǔ)要(yào)突出的是(shì)高清,与Meta的Make-A-Video没有太多(duō)的差别。

在Make-A-Video公布了AI生(shēng)成的视频后,AI圈就已(yǐ)经玩了(le)一波梗,一个能够做出更(gèng)高清视频的AI还不足以在短(duǎn)时间内戳(chuō)中兴奋点(diǎn)。

Phenaki更加(jiā)令人(rén)震惊(jīng)的地方在于,它(tā)可以制(zhì)作出超过2分(fēn)钟的(de)连贯的(de)也有(yǒu)确切内容的视频,这才是真正让人们感(gǎn)到惊喜的地方(fāng)。因为无论AI生(shēng)成的视频多么高清,也(yě)只能(néng)是为(wèi)内容生(shēng)产者提(tí)供一个灵感,一个素材,一(yī)个过场动(dòng)画。

不过能(néng)够(gòu)制作出(chū)有具体剧情(qíng)内容(róng)的视频就(jiù)意(yì)味着,一些视频创(chuàng)作(zuò)由AI代替人(rén)工完成(chéng)已经初步有了可能。

当下AI的发展速度已(yǐ)经超过大部分人的想(xiǎng)象。内容产业的(de)本质是供给创造需求,AIGC作为全新的内容生产(chǎn)方式(shì),可以(yǐ)为内容产业带来更新的内容风格、更快(kuài)的生产(chǎn)速(sù)度,更(gèng)低的生(shēng)产(chǎn)成本,这无疑(yí)会驱动内容产业的(de)大爆发。

除了AI绘(huì)图、视频,AIGC技术(shù)还(hái)能应(yīng)用于音乐、代码、机器人(rén)动作等(děng)多种内容形式(shì)的生成。不(bù)难发现该项技术不仅在(zài)游(yóu)戏等行业能得到(dào)有效(xiào)应(yīng)用,对(duì)于(yú)下一代互联(lián)网各种元素的构建亦(yì)有关键意义。

从商(shāng)业化(huà)的角度来看(kàn),文化娱乐、教育、传媒等诸(zhū)多(duō)领(lǐng)域(yù),本身就对基于AI的可视化内(nèi)容有强烈需求。

因此,AI绘画(huà领略的意思)及(jí)视(shì)频或不是结(jié)果(guǒ),而只是AI进程(chéng)中的一块(kuài)重要(yào)拼图,有望(wàng)在技术更新的加持下实现(xiàn)更(gèng)大的应用价(jià)值。

AI从理解内容,走向了(le)可(kě)以生成内容,甚至能够创造出(chū)独立价值和独立视角的内容。AIGC的再次出圈,更代表着未来的先进生(shēng)产力即将到来。

ChatGPT之后(hòu)又一应用杀(shā)疯了(le),AIGC或进入可控(kòng)期,将洗牌科(kē)技行业?_黑料(liào)正能量

04

紧(jǐn)抓(zhuā)大模(mó)型与算力,牢固AIGC底座

从(cóng)技(jì)术的发展也可(kě)以看(kàn)出,在语言大模型、图像(xiàng)大模(mó)型之后,多模态大模(mó)型已经(jīng)成为了新的(de)趋势(shì)。

大模型(xíng)被誉为当前人(rén)工智能发展(zhǎn)的智能底座,是全球竞争最激烈的研(yán)究方向之一,包括谷歌、亚马逊、百度(dù)、阿(ā)里(lǐ)、腾讯(xùn)等众多头部(bù)企业都在竞(jìng)相(xiāng)发力。

不过(guò)训练(liàn)大模型(xíng)的(de)确价格不菲,以国(guó)盛(shèng)证券发布的(de)《ChatGPT需(xū)要多(duō)少算(suàn)力》报告估算(suàn),GPT-3训练一次的成本(běn)约(yuē)为140万美元。而对于一(yī)些更大的LLM(大(dà)型语言模型(xíng)),训练(liàn)成(chéng)本则介于200万美元至(zhì)1200万美元高价之间(jiān)。

以ChatGPT在2023年(nián)1月的独立访客平均(jūn)数1300万计(jì)算,其对应芯(xīn)片需求为3万多片英伟达A100 GPU,初(chū)始投(tóu)入成(chéng)本约为8亿美元,每日仅电费就在5万美元左(zuǒ)右(yòu)。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进(jìn)入可(kě)控期,将洗牌科技行(xíng)业?_黑料正能量

此外不(bù)论(lùn)是(shì)ChatGPT还是AIGC,都(dōu)离不开庞(páng)大算力支(zhī)持。在关注各类(lèi)大模型(xíng)的发(fā)展同时(shí),更应该(gāi)关(guān)注(zhù)算力网络(luò)的建设。

算力网络(luò)正驱动AI产业发展进入史诗级加速进程(chéng),让AIGC及通(tōng)用AI这(zhè)一人工智(zhì)能发展的终(zhōng)极目标离得(dé)更(gèng)近。

因为算力可以(yǐ)对突破性(xìng)技术(shù)创新提供大力(lì)的(de)支持。这方面,多模态大(dà)模(mó)型是典型。作(zuò)为面(miàn)向(xiàng)未来强人工智(zhì)能(néng)、通用人工(gōng)智能(néng)的重要技术创新,多模(mó)态(tài)大模型已经在(zài)人工(gōng)智能领域提出了很多(duō)年(nián),业(yè)界也有不少技(jì)术突破,但是(shì),多模态大模型进一步往(wǎng)下走,算力需(xū)求呈几何(hé)式上升,一般的算(suàn)力(lì)基(jī)础设施(shī)很快将难(nán)以胜任。

从(cóng)图像、文字、语音单(dān)独一(yī)项的训练,到双模态、三(sān)模态的跃迁,让人工智能可以灵活(huó)应对不同模态的(de)转(zhuǎn)化(huà)、像人与世(shì)界交(jiāo)互一样自然,这方面,由算(suàn)力网络来驱动将(jiāng)有明显优势。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯(fēng)了,AIGC或(huò)进(jìn)入可控(kòng)期,将洗(xǐ)牌(pái)科技(jì)行业(yè)?_黑料正能量(liàng)

此外,还有很多(duō)需要爆发式增长的算力来(lái)支(zhī)撑的技术创新,将(jiāng)在人工智能(néng)算力网络支(zhī)撑下快速推进。

AIGC已(yǐ)经露(lù)出(chū)曙光,期待在大模型和大算力的(de)支持下AIGC能(néng)持续颠覆内容(róng)生(shēng)产(chǎn)的(de)方式,将创造的边际成本降(jiàng)低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 领略的意思

评论

5+2=