两只小白兔在衬衫里抖来抖去，老师两只大兔子来回晃-橘子百科-橘子都知道

两只小白兔在衬衫里抖来抖去，老师两只大兔子来回晃 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天(tiān)机器(qì)人ChatGPT火爆以来，微软公司创始人(rén)比(bǐ)尔·盖茨(cí)已多次公开谈论(lùn)人工智能话题。在最(zuì)近的一(yī)次采访(fǎng)中(zhōng)，他再(zài)次表示：“AI可能会让科技行业(yè)迎来一(yī)次剧烈的洗牌”。

这个结论是他在当地时(shí)间2月(yuè)20日接受《In Good Company》节目专访(fǎng)时提出的。

他预期，AI的发展可能会(huì)威胁到谷歌的市占率，因为微软在AI方面的(de)行动相(xiāng)当迅速。而最终科(kē)技(jì)巨头将把AI整合(hé)成用户的(de)“全能助(zhù)手”，包揽(lǎn)一切应用，与(yǔ)人们进(jìn)行(xíng)沟通并提供建议，可以取代亚(yà)马逊、Siri或Outlook等应用。

大(dà)佬口(kǒu)中全能助(zhù)手的到来可能尚(shàng)需(xū)时日，但由(yóu)ControlNet引发的又一次AI绘(huì)画浪潮，让(ràng)AIGC在ChatGPT的话题热点包围中杀出重(zhòng)围。

ChatGPT之后又一(yī)应用杀(shā)疯了，AIGC或进入可(kě)控(kòng)期，将洗牌科技行业？_黑料正能量(liàng)

ControlNet颠覆AI绘(huì)画新玩法

AIGC向可控靠近

以AI绘画为代(dài)表的AIGC上一次爆火的(de)时候，还是(shì)2022年8月，在(zài)美国科罗拉多(duō)州举办的新兴数字(zì)艺术家竞赛中(zhōng)，一幅名为《太空歌(gē)剧院(yuàn)》的(de)作品获(huò)奖。

随(suí)后各大厂商(shāng)的AI绘(huì)画软件(jiàn)被广大(dà)网友熟知(zhī)并体验，Stable Diffusion便是其中代表(biǎo)。

用户们可以在(zài)应用中输入一(yī)组关键词(cí)或者一张照片，就能获得(dé)一幅(fú)AI创作的画作(zuò)。

作画的关键就是所输入的(de)文(wén)本。同一组关键词(cí)也(yě)可以创作出很多张风(fēng)格不一(yī)样(yàng)的画作(zuò)，这(zhè)让创作的过程就像(xiàng)开盲(máng)盒。

很多用户很喜(xǐ)欢(huān)这种不确定的惊喜(xǐ)，他们会将生成的(de)美图(tú)当做头像。而另一(yī)部分喜欢(huān)翻看AI绘画的(de)“翻车(chē)”作(zuò)品。在社(shè)交媒体上，许多用(yòng)户(hù)分享AI“翻(fān)车现场”，例(lì)如，一位网友的小狗照片被AI画(huà)成了“肌肉男”，还有(yǒu)网友(yǒu)的个人(rén)照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加(jiā)持，以往AI绘(huì)画(huà)的填写关键词游戏可能要被颠覆了。

ControlNet是一位正在(zài)斯坦福读博的(de)中国人张(zhāng)吕(lǚ)敏创作的一种基于控制点的(de)图(tú)像变(biàn)形算法(fǎ)，主要(yào)用于数字图像处理、计算(suàn)机视觉和计算机图形学等领域。

其(qí)SD插件(jiàn)一经发布(bù)，在短(duǎn)短(duǎn)的两(liǎng)天(tiān)内便成为了AI绘画(huà)领域(yù)最新的(de)热点(diǎn)。

在(zài)此之前，大(dà)家用了(le)很多方法(fǎ)想让AI生成的结果(guǒ)尽可能的符合(hé)要求(qiú)，但是都不尽如人意，它(tā)的(de)出现代(dài)表着AI生成开始(shǐ)进(jìn)入真正的可(kě)控时期。

因为ControlNet可以(yǐ)直接提取画面(miàn)的构图(tú)，人物的姿势和画面的深度(dù)信(xìn)息等。有了(le)它的帮助，就不用频繁的用提示词来碰(pèng)运气，抽盲盒式的(de)创作了。

通俗(sú)的说ControlNet相当(dāng)于给AI绘(huì)画加了“魔(mó)法”，不少(shǎo)博主(zhǔ)的作(zuò)品已(yǐ)经获得了大量的浏览量，“viggo”就是(shì)其中之一，他(tā)用朋友(yǒu)的照片直接带她们走(zǒu)进动漫(màn)世界(jiè)。

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找到对应的关键(jiàn)词；最后(hòu)用ControlNet插(chā)件绑定骨骼开始换关键词试效果(guǒ)。

通过图片(piàn)就可(kě)以(yǐ)看出来，效(xiào)果十分(fēn)惊艳(yàn)。

更厉害的是，除(chú)了真实的(de)照片，草图也可以加(jiā)上“魔法”，知乎大牛“DevPoint”和“逗砂”介(jiè)绍(shào)到ControlNet还能实(shí)现线稿转全彩图(tú)。大神张吕敏其(qí)本尊也亲自回应。

不得(dé)不说当下AIGC已经(jīng)变(biàn)得越来越强大，甚至(zhì)输出的(de)作品都(dōu)已经(jīng)能以(yǐ)假乱真了。

难(nán)辨(biàn)虚实，AIGC技术力爆发

警惕安全问题

近日(rì)，“苏州金(jīn)鸡湖有游(yóu)艇party”的消(xiāo)息(xī)火遍网络，而经(jīng)过警方(fāng)辟谣这所谓的“party”可能(néng)是全国第一起AI绘图诈骗。

由于这个活动里面给出的(de)美女照片都(dōu)是AI制作的真人照片绘图，因为太逼(bī)真，被大家当成(chéng)真事传(chuán)播了。

不过仔细观(guān)察可以发现，活(huó)动发起者(zhě)提供的(de)照片中(zhōng)有个(gè)很大的漏洞可(kě)以发现(xiàn)并非真(zhēn)人，而是AI绘图，那便是图片中女(nǚ)性(xìng)的手(shǒu)指(zhǐ)部(bù)分有的存在异常。

ChatGPT之后又一应用(yòng)杀疯了，AIGC或进(jìn)入可控期，将(jiāng)洗(<span style='color: #ff0000; line-height: 24px;'>两只小白兔在衬衫里抖来抖去，老师两只大兔子来回晃</span>xǐ)牌(pái)科(kē)技行业？_黑料正能(néng)量(liàng)

有行(xíng)业(yè)人事表示：“现(xiàn)在因为(wèi)手(shǒu)指部分的(de)绘(huì)画(huà)算法比较复杂，AI还不(bù)太(tài)会画人(rén)的手，但最新(xīn)看到的(de)图片已(yǐ)经有(yǒu)越来越完美的AI模型出现，以后(hòu)可能就(jiù)完(wán)全没(méi)有漏(lòu)洞了。”

类似的AI作(zuò)图诈骗在(zài)国(guó)外也已(yǐ)有发生。据英(yīng)国广播公司报道(dào)，土耳其地震期间，有Tiktok用户使用AI合成了儿童受(shòu)灾的假照片发(fā)布(bù)到网络，以此诱骗善良的人打赏“捐助(zhù)”从而实施(shī)诈(zhà)骗(piàn)。

目(mù)前随着(zhe)技术发展，AIGC已(yǐ)经(jīng)能做出真人照片般的(de)绘图(tú)效果，如果这(zhè)样的图片被(bèi)用来诈骗，将非常可怕。

此外AIGC还引发了很(hěn)多(duō)担忧，一方(fāng)面，批(pī)判者(zhě)认为AI在(zài)“学习”了大量前人的作品之后，其创作(zuò)没有任何情绪和灵魂，难以和人类的艺术(shù)创(chuàng)作相(xiāng)提(tí)并论(lùn)。

另一方面，AIGC背后(hòu)的版权、目前都并没有(yǒu)得到有效的解决，还有AIGC会不会代替人类“至高无上”的创意(yì)。

马斯克也强(qiáng)调，人工智能的安全问题需要得到重视，太晚就来不及了。

AIGC下(xià)一站除了视(shì)频，还有远方

技术都是有两面性的，潜在的(de)危害(hài)并不能掩盖(gài)其光辉的贡献(xiàn)。现在看(kàn)来，人工智能技(jì)术将是(shì)第(dì)四次工(gōng)业革命(mìng)的核心(xīn)驱动力量，将创造新(xīn)的增长奇迹。

过去一(yī)年，人工智能在技术和商业层面都(dōu)有了巨大进展，AI绘画就是(shì)人工智能技术发生方向性改变的(de)一个代表。其下一(yī)站或许(xǔ)就是视频。

此前，Meta和谷歌先后发布了几(jǐ)条引(yǐn)爆科技圈(quān)的短(duǎn)视频。这些视频引发关注并非(fēi)内(nèi)容做得(dé)多优秀(xiù)，反而都非常简单(dān)，比如一匹正(zhèng)在喝水的马，一(yī)只画(huà)画的玩具熊，或者一(yī)段骑摩托(tuō)车的第一视角(jiǎo)录像，随便一个(gè)有(yǒu)手(shǒu)机的人都可以随手录下一段。

但这(zhè)些短视频(pín)的创作方式非(fēi)常(cháng)简单，创作者仅仅需要(yào)向AI输入(rù)一段(duàn)话，甚至(zhì)只(zhǐ)是说一(yī)下要求(qiú)，AI就可以根(gēn)据需要生成一(yī)段视频。

谷歌发布(bù)的两个(gè)AI生成视频分别来自于Imagen Video和Phenaki，前者(zhě)主要(yào)突出的是高清，与Meta的Make-A-Video没有(yǒu)太多的差别(bié)。

在Make-A-Video公布了(le)AI生成的(de)视频(pín)后(hòu)，AI圈就已经玩了一波梗，一个能够做(zuò)出更高清视频的AI还不足以在(zài)短时间(jiān)内戳中(zhōng)兴奋点。

Phenaki更加(jiā)令人(rén)震惊的地(dì)方在于(yú)，它可以制作出超过2分钟的连贯的也有确切内容的(de)视频，这才(cái)是真正让人们感到(dào)惊喜(xǐ)的地方(fāng)。因为无论AI生(shēng)成的视频(pín)多么高清，也只能是为内容生产者提(tí)供一个(gè)灵感，一(yī)个素材，一(yī)个过场动(dòng)画。

不过(guò)能够制(zhì)作出有具体剧(jù)情(qíng)内容的视频就意味着，一些视(shì)频(pín)创作由(yóu)AI代(dài)替人工完成已经初步有了可能。

当下AI的(de)发展速度已经超过大部分人的想象(xiàng)。内容产业的本质(zhì)是供给(gěi)创造需求，AIGC作为全新(xīn)的内容生产方式，可(kě)以为内容产业带来更新的内(nèi)容风格(gé)、更快的(de)生产速度，更低的生产(chǎn)成本，这(zhè)无(wú)疑会驱动内(nèi)容产业的(de)大爆发。

除了AI绘图、视频，AIGC技术(shù)还能应用于音乐、代码(mǎ)、机器(qì)人动作等(děng)多(duō)种(zhǒng)内容形式的(de)生成(chéng)。不难发现该项技术不仅在游戏等行业(yè)能得到有效应(yīng)用，对于(yú)下一代互联(lián)网各种元素的构建亦有关键意义(yì)。

从(cóng)商业(yè)化的角(jiǎo)度来看，文(wén)化娱乐、教育(yù)、传媒等诸多领域，本身就对基于AI的可视(shì)化内容有强(qiáng)烈需求。

因此，AI绘画及视频或不是(shì)结果，而(ér)只是AI进程中的一块重要拼图，有望在(zài)技术(shù)更新的加持下实(shí)现更大(dà)的应用价值。

AI从(cóng)理解内容，走(zǒu)向了(le)可以生(shēng)成内容，甚至能(néng)够创造出(chū)独立(lì)价值和(hé)独(dú)立视角的内容。AIGC的(de)再次出圈(quān)，更代表着未来的先进生产力(lì)即将到来。

紧抓大模型与算力，牢固AIGC底座

从技术的发展也(yě)可以看(kàn)出，在语言大模型(xíng)、图像大(dà)模型之后，多模态大模型已经成(chéng)为了新的趋势。

大模型被誉为当(dāng)前人工智(zhì)能(néng)发展的智能底座，是全球(qiú)竞(jìng)争最激烈的(de)研(yán)究(jiū)方向之一，包括(kuò)谷(gǔ)歌、亚马(mǎ)逊、百度、阿里、腾(téng)讯等(děng)众多头部企业都在竞相发(fā)力(lì)。

不过(guò)训练(liàn)大模型的(de)确价格不菲，以国盛证券发布的《ChatGPT需(xū)要多少算力》报告估算，GPT-3训练(liàn)一次的成本约为140万美元。而对于(yú)一些更大的(de)LLM(大型(xíng)语言模型)，训练(liàn)成本则介(jiè)于200万美元至(zhì)1200万美元高价之间。

以(yǐ)ChatGPT在2023年1月的独立访客(kè)平均(jūn)数1300万计算，其对应芯片(piàn)需求为3万多(duō)片英伟达(dá)A100 GPU，初始投(tóu)入成本约为8亿美元，每日仅(jǐn)电(diàn)费就(jiù)在(zài)5万美(měi)元左右。

此外不论是ChatGPT还是AIGC，都离不开庞大算力(lì)支持。在关注各类大模型的(de)发展同时，更应(yīng)该关注(zhù)算(suàn)力网络的建设。

算力网络正(zhèng)驱(qū)动AI产业发展(zhǎn)进入史诗级加速进(jìn)程(chéng)，让AIGC及通用AI这一人工智能发(fā)展的终极目标离(lí)得更近。

因为算力可以(yǐ)对突破性(xìng)技术创(chuàng)新提供大力的(de)支持。这方面，多模态大模型是典型(xíng)。作为(wèi)面向未来强人工智能(néng)、通用人工智能的重要技术(shù)创新，多模(mó)态大模型已经在人(rén)工智(zhì)能领域提出了很多年，业界也有不少技(jì)术突(tū)破，但是，多模态大模型进一步往下走，算力需求呈几(jǐ)何式上升，一般的算力(lì)基础设施很快将难以(yǐ)胜任。

从图像(xiàng)、文字、语(yǔ)音单独一项(xiàng)的训练，到双模态、三模态的跃迁，让人(rén)工智能可以灵(líng)活应对不同模态(tài)的转化、像人与(yǔ)世(shì)界(jiè)交互(hù)一样自(zì)然，这方面(miàn)，由(yóu)算力网(wǎng)络来驱动(dòng)将有明显优势。