领略的意思-橘子百科-橘子都知道

领略的意思 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊(liáo)天(tiān)机器人ChatGPT火爆以来，微(wēi)软公(gōng)司创始(shǐ)人(rén)比(bǐ)尔(ěr)·盖茨已(yǐ)多次公开(kāi)谈论人工智能话(huà)题(tí)。在(zài)最近(jìn)的一次采访中，他再次(cì)表(biǎo)示：“AI可能会让科技(jì)行业迎来一(yī)次剧烈(liè)的洗牌”。

这个结论(lùn)是他在当地时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预(yù)期，AI的发展可(kě)能会威胁到(dào)谷歌的市占(zhàn)率，因为微(wēi)软在AI方面的行动相当迅速。而最终科技巨头(tóu)将把AI整合(hé)成用(yòng)户(hù)的“全能助(zhù)手”，包(bāo)揽一(yī)切应(yīng)用，与(yǔ)人(rén)们进(jìn)行沟通并提供建议，可(kě)以取代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能(néng)助手的到来可(kě)能尚(shàng)需时日，但由ControlNet引发的又一次AI绘画浪潮(cháo)，让AIGC在ChatGPT的话(huà)题热点包围中杀出重围。

ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？_黑(hēi)料正(zhèng)能(néng)量(liàng)

ControlNet颠覆(fù)AI绘(huì)画新(xīn)玩法

AIGC向可控靠(kào)近

以AI绘画为(wèi)代(dài)表的AIGC上一次(cì)爆火的时候(hòu)，还是2022年8月(yuè)，在美国科(kē)罗拉多州(zhōu)举办的新兴数字艺术家竞赛(sài)中，一幅名为《太空歌(gē)剧院》的作品获奖。

随后(hòu)各大厂(chǎng)商(shāng)的AI绘画软件被广(guǎng)大网(wǎng)友(yǒu)熟知并(bìng)体(tǐ)验，Stable Diffusion便是其中代表(biǎo)。

用户(hù)们可以在应用(yòng)中输入一组关(guān)键词或者一张照片，就(jiù)能获得一幅AI创(chuàng)作的画作。

作画的关键就是所输入的文本。同一组关键词也可以创作出很多(duō)张风格(gé)不一样的画作，这让创作(zuò)的过程(chéng)就像开(kāi)盲盒。

很多(duō)用户很喜欢这种(zhǒng)不确(què)定的惊喜，他们会将(jiāng)生(shēng)成的美图当做头(tóu)像(xiàng)。而另一部(bù)分喜欢翻(fān)看AI绘画的(de)“翻车”作品。在(zài)社交媒(méi)体上，许多用户分(fēn)享AI“翻车现场(chǎng)”，例如(rú)，一位网友的小狗照片被AI画成了“肌肉男”，还有网友的个人照片被AI识别成了建筑。

而如今随着ControlNet的出现(xiàn)与加持，以(yǐ)往AI绘(huì)画的填(tián)写关键词(cí)游戏可能要(yào)被颠覆了。

ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？_黑料正能量领略的意思"https://mmbiz.heiliaofuli.com/wp-content/uploads/2023/03/19d7ab2c0056bd4.jpeg?imageMogr2/thumbnail/2160x0/format/webp/quality/80" data-ratio="1.12109375" data-s="300,640" data-type="jpeg" data-w="1024">

ControlNet是一(yī)位正在斯坦福读博(bó)的中国人(rén)张吕敏(mǐn)创作(zuò)的一种基(jī)于(yú)控制点的图(tú)像变(biàn)形(xíng)算法，主要用于数字图像处理、计算机(jī)视觉(jué)和计算机图形学等(děng)领域(yù)。

其SD插件一经发(fā)布(bù)，在短短(duǎn)的两(liǎng)天内便(biàn)成为了AI绘画领(lǐng)域最新的热(rè)点。

在(zài)此之前，大(dà)家用了很多方(fāng)法想让AI生成的结果尽可能的(de)符(fú)合要求，但(dàn)是都不尽(jǐn)如人(rén)意，它的出现代表着AI生成开(kāi)始(shǐ)进入真正的(de)可控时期。

因为ControlNet可以(yǐ)直接提取画面(miàn)的(de)构(gòu)图，人物的姿(zī)势和(hé)画面(miàn)的深度信息等。有了它(tā)的帮助，就不(bù)用频繁的用提示词来碰运气，抽盲(máng)盒(hé)式的创作了(le)。

通俗(sú)的说ControlNet相当于给AI绘画(huà)加了“魔法”，不少博主的作(zuò)品已经(jīng)获得(dé)了大量的浏览量，“viggo”就是其中(zhōng)之一(yī)，他(tā)用(yòng)朋友的(de)照片直接带她们走进动漫世界。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找到(dào)对应的关键词；最后(hòu)用ControlNet插件绑(bǎng)定(dìng)骨骼开始换关键词(cí)试效果。

通过图片(piàn)就(jiù)可以看出来(lái)，效果十分惊艳。

更厉害的是，除了真实的照片，草图也可以加上“魔(mó)法”，知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还(hái)能实现线稿转(zhuǎn)全(quán)彩图。大神张(zhāng)吕敏其本尊也亲自回应。

不(bù)得不说当下AIGC已经变得越来(lái)越强大(dà)，甚至输出的作品都(dōu)已经(jīng)能以假乱真了。

难(nán)辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州(zhōu)金鸡湖有游艇party”的消息火遍网(wǎng)络(luò)，而(ér)经过警方辟谣这所谓的“party”可能是全(quán)国第(dì)一起AI绘图诈骗。

由于这(zhè)个活(huó)动里面给出的美女照片都是AI制作(zuò)的真人照(zhào)片绘(huì)图，因为太(tài)逼真(zhēn)，被(bèi)大家当成真事传播(bō)了。

不过(guò)仔细观(guān)察可以发现，活动发起者提供的照(zhào)片中有个很大的(de)漏洞可以发现(xiàn)并非真人，而是AI绘图，那便是图(tú)片(piàn)中女性的手指部分有(yǒu)的(de)存在异(yì)常(cháng)。

ChatGPT之后又一应用(yòng)杀疯了，AIGC或进(jìn)入可控(kòng)期，将洗牌(pái)科技行业？_黑料正(zhèng)能(néng)量

有行(xíng)业人事表示：“现在因(yīn)为手指(zhǐ)部(bù)分的绘画算法比较复杂，AI还不太会(huì)画人的手，但最新看到(dào)的图(tú)片已经有(yǒu)越来越(yuè)完美的AI模型出现，以后(hòu)可(kě)能就完全没有漏洞了。”

类似的AI作图诈(zhà)骗(piàn)在国(guó)外(wài)也已(yǐ)有发生(shēng)。据英国广播公(gōng)司报(bào)道，土耳其(qí)地震期间，有Tiktok用(yòng)户使用(yòng)AI合成(chéng)了儿童受灾的(de)假照片发布到网络(luò)，以(yǐ)此诱(yòu)骗(piàn)善良的人打赏“捐助”从而实施诈骗。

目前随着技术(shù)发展，AIGC已经能做(zuò)出(chū)真人照(zhào)片般的绘(huì)图效果，如果这样(yàng)的(de)图(tú)片被(bèi)用来诈(zhà)骗，将非常(cháng)可怕。

此外(wài)AIGC还引(yǐn)发了很多担忧，一方面(miàn)，批判者(zhě)认为AI在“学习”了大(dà)量(liàng)前(qián)人(rén)的作(zuò)品之后，其创(chuàng)作没有任何情绪和(hé)灵(líng)魂，难以和人类的艺术(shù)创作(zuò)相提并论。

另一(yī)方面，AIGC背后的版权、目前都并(bìng)没有得到有效(xiào)的解决，还有AIGC会不会代替人(rén)类“至高无上(shàng)”的创(chuàng)意。

马斯克(kè)也强调，人工智能(néng)的(de)安全问题需要得到(dào)重视，太晚就(jiù)来不及了。

AIGC下一站除(chú)了视频，还有远(yuǎn)方

技术都是有两面性的(de)，潜在的危(wēi)害并不能掩盖其光辉的(de)贡献。现(xiàn)在看来，人工智能(néng)技(jì)术将是第四次工业革命的核心驱动(dòng)力量，将创造新的(de)增长(zhǎng)奇迹。

过(guò)去一(yī)年，人(rén)工智能(néng)在技(jì)术和商业(yè)层面都有了巨(jù)大进展，AI绘画就是人工(gōng)智能技术发生方(fāng)向性(xìng)改变的(de)一(yī)个代表。其下一站或(huò)许就是视频。

此(cǐ)前，Meta和谷歌先(xiān)后(hòu)发布了几条(tiáo)引(yǐn)爆(bào)科技圈的(de)短视频。这些视频引发关注并非内容做(zuò)得多优秀(xiù)，反(fǎn)而都非常简单，比如一(yī)匹正在喝水的(de)马，一只画画的玩具熊，或者一段(duàn)骑摩托车(chē)的第一视角(jiǎo)录像，随便一个(gè)有手机的人都(dōu)可以随(suí)手录(lù)下一段。

但这些短视频的(de)创作方式非常(cháng)简(jiǎn)单，创作者(zhě)仅仅需要向AI输入一段话(huà)，甚至只是(shì)说(shuō)一下要求，AI就可(kě)以根据(jù)需要生成一段视频。

谷歌发布的两个AI生成(chéng)视频分别来自于(yú)领略的意思Imagen Video和Phenaki，前者主(zhǔ)要(yào)突出的是(shì)高清，与Meta的Make-A-Video没有太多(duō)的差别。

在Make-A-Video公布了AI生(shēng)成的视频后，AI圈就已(yǐ)经玩了(le)一波梗，一个能够做出更(gèng)高清视频的AI还不足以在短(duǎn)时间内戳(chuō)中兴奋点(diǎn)。

Phenaki更加(jiā)令人(rén)震惊(jīng)的地方在于，它(tā)可以制(zhì)作出超过2分(fēn)钟的(de)连贯的(de)也有(yǒu)确切内容的视频，这才是真正让人们感(gǎn)到惊喜的地方(fāng)。因为无论AI生(shēng)成的视频多么高清，也(yě)只能(néng)是为(wèi)内容生(shēng)产者提(tí)供一个灵感，一个素材，一(yī)个过场动(dòng)画。

不过能(néng)够(gòu)制作出(chū)有具体剧情(qíng)内容(róng)的视频就(jiù)意(yì)味着，一些视频创(chuàng)作(zuò)由AI代替人(rén)工完成(chéng)已经初步有了可能。

当下AI的发展速度已(yǐ)经超过大部分人的想(xiǎng)象。内容产业的(de)本质是供给创造需求，AIGC作为全新的内容生产(chǎn)方式(shì)，可以(yǐ)为内容产业带来更新的内容风格、更快(kuài)的生产(chǎn)速(sù)度，更(gèng)低的生(shēng)产(chǎn)成本，这无疑(yí)会驱动内容产业的(de)大爆发。

除了AI绘(huì)图、视频，AIGC技术(shù)还(hái)能应(yīng)用于音乐、代码、机器人(rén)动作等(děng)多种内容形式(shì)的生成。不(bù)难发现该项技术不仅在(zài)游(yóu)戏等行业能得到(dào)有效(xiào)应(yīng)用，对(duì)于(yú)下一代互联(lián)网各种元素的构建亦(yì)有关键意义。

从商(shāng)业化(huà)的角度来看(kàn)，文化娱乐、教育、传媒等诸(zhū)多(duō)领(lǐng)域(yù)，本身就对基于AI的可视化内(nèi)容有强烈需求。

因此，AI绘画(huà领略的意思)及(jí)视(shì)频或不是结(jié)果(guǒ)，而只是AI进程(chéng)中的一块(kuài)重要(yào)拼图，有望(wàng)在技术更新的加持下实现(xiàn)更(gèng)大的应用价(jià)值。

AI从理解内容，走向了(le)可(kě)以生成内容，甚至能够创造出(chū)独立价值和独立视角的内容。AIGC的再次出圈，更代表着未来的先进生(shēng)产力即将到来。

紧(jǐn)抓(zhuā)大模(mó)型与算力，牢固AIGC底座

从(cóng)技(jì)术的发展也可(kě)以看(kàn)出，在语言大模型、图像(xiàng)大模(mó)型之后，多模态大模(mó)型已经(jīng)成为了新的(de)趋势(shì)。

大模型(xíng)被誉为当前人(rén)工智能发展(zhǎn)的智能底座，是全球竞争最激烈的研(yán)究方向之一，包括谷歌、亚马逊、百度(dù)、阿(ā)里(lǐ)、腾讯(xùn)等众多头部(bù)企业都在竞(jìng)相(xiāng)发力。

不过(guò)训练(liàn)大模型(xíng)的(de)确价格不菲，以国(guó)盛(shèng)证券发布的(de)《ChatGPT需(xū)要多(duō)少算(suàn)力》报告估算(suàn)，GPT-3训练一次的成本(běn)约(yuē)为140万美元。而对于一(yī)些更大的LLM(大(dà)型语言模型(xíng))，训练(liàn)成(chéng)本则介于200万美元至(zhì)1200万美元高价之间(jiān)。

以ChatGPT在2023年(nián)1月的独立访客平均(jūn)数1300万计(jì)算，其对应芯(xīn)片需求为3万多片英伟达A100 GPU，初(chū)始投(tóu)入成(chéng)本约为8亿美元，每日仅电费就在5万美元左(zuǒ)右(yòu)。

此外不(bù)论(lùn)是(shì)ChatGPT还是AIGC，都(dōu)离不开庞(páng)大算力支(zhī)持。在关注各类(lèi)大模型(xíng)的发(fā)展同时(shí)，更应该(gāi)关(guān)注(zhù)算力网络(luò)的建设。

算力网络(luò)正驱动AI产业发展进入史诗级加速进程(chéng)，让AIGC及通(tōng)用AI这(zhè)一人工智(zhì)能发展的终(zhōng)极目标离得(dé)更(gèng)近。

因为算力可以(yǐ)对突破性(xìng)技术(shù)创新提供大力(lì)的(de)支持。这方面，多模态大(dà)模(mó)型是典型。作(zuò)为面(miàn)向(xiàng)未来强人工智(zhì)能(néng)、通用人工(gōng)智能(néng)的重要技术创新，多模(mó)态(tài)大模型已经在(zài)人工(gōng)智能领域提出了很多(duō)年(nián)，业(yè)界也有不少技(jì)术突破，但是(shì)，多模态大模型进一步往(wǎng)下走，算力需(xū)求呈几何(hé)式上升，一般的算(suàn)力(lì)基(jī)础设施(shī)很快将难(nán)以胜任。

从(cóng)图像、文字、语音单(dān)独一(yī)项的训练，到双模态、三(sān)模态的跃迁，让人工智能可以灵活(huó)应对不同模态的(de)转(zhuǎn)化(huà)、像人与世(shì)界交(jiāo)互一样自然，这方面，由算(suàn)力网络来驱动将(jiāng)有明显优势。