发奋还是发愤读书啊，发奋还是发愤图强-橘子百科-橘子都知道

发奋还是发愤读书啊，发奋还是发愤图强 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊(liáo)天机器(qì)人ChatGPT火(huǒ)爆(bào)以来，微软公司创始人比尔·盖茨已多(duō)次公开(kāi)谈论人工智能话题(tí)。在最近的一次采访中，他再次表示：“AI可能(néng)会让科技行业迎来一次剧烈的洗牌”。

这个(gè)结(jié)论是(shì)他在当地时间2月20日接受《In Good Company》节目专(zhuān)访时提出(chū)的。

他预期，AI的发展可(kě)能会威胁(xié)到谷歌的市占率，因(yīn)为微软在AI方面的行动(dòng)相当迅(xùn)速。而最终科(kē)技(jì)巨(jù)头将把(bǎ)AI整合成用户的“全能助手”，包(bāo)揽一(yī)切应用，与人们进行沟(gōu)通并提供建(jiàn)议，可(kě)以取代亚(yà)马逊、Siri或Outlook等应用。

大佬口中全能(néng)助手的到来可能尚(shàng)需时(shí)日(rì)，但由ControlNet引发(fā)的又一次AI绘画(huà)浪(làng)潮，让AIGC在ChatGPT的话题热点包围中(zhōng)杀出重围。

ChatGPT之后又一应用杀疯了，AIGC或(huò)进入可控期(qī)，将洗牌科技(jì)行(xíng)业？_黑(hēi)料正(zhèng)能量

ControlNet颠(diān)覆AI绘(huì)画新玩法

AIGC向可控靠近

以AI绘画(huà)为代表的AIGC上一次(cì)爆火的时候，还(hái)是2022年8月，在美国科罗拉多州举办的新兴数字(zì)艺术家竞(jìng)赛中，一幅名为《太空歌剧(jù)院》的作品获奖。

随后(hòu)各大厂商的AI绘画软件被广(guǎng)大网友熟(shú)知并(bìng)体验，Stable Diffusion便(biàn)是其中(zhōng)代表。

用户们可(kě)以在应用中输入一组关(guān)键词或者一张照片，就能(néng)获得一幅(fú)AI创作的画作。

作画的(de)关键就是所输入(rù)的文本。同一组关键(jiàn)词也可以创作出(chū)很多张(zhāng)风格不一样的画作，这让创作的(de)过程(chéng)就像开(kāi)盲(máng)盒(hé)。

很多用户很喜欢这种不确定(dìng)的惊喜，他们会将生成的美图当做头像。而另一部(bù)分喜欢(huān)翻(fān)看AI绘画(huà)的“翻车”作品。在社交媒体上(shàng)，许多用(yòng)户(hù)分享AI“翻车现场”，例如，一位网友(yǒu)的小狗照片被AI画发奋还是发愤读书啊，发奋还是发愤图强成了(le)“肌肉(ròu)男”，还有网友的个(gè)人照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加持，以往AI绘(huì)画的填写关键词游(yóu)戏可能(néng)要(yào)被颠覆了。

ControlNet是一位正在斯坦(tǎn)福读博(bó)的中(zhōng)国人张吕敏创作(zuò)的(de)一种基于控制点的图像(xiàng)变形算法，主要(yào)用于(yú)数字图像处理、计算机(jī)视觉和计算机图形(xíng)学(xué)等领域。

其(qí)SD插件一经发布，在(zài)短(duǎn)短的两天(tiān)内便成(chéng)为了AI绘(huì)画领(lǐng)域最新的热点。

在(zài)此之(zhī)前，大(dà)家用了(le)很多(duō)方法想让AI生成的(de)结果(guǒ)尽可(kě)能的符合(hé)要求，但是都(dōu)不尽(jǐn)如(rú)人意，它的出现代表着AI生成(chéng)开(kāi)始进(jìn)入真(zhēn)正的(de)可控时期。

因为ControlNet可以直接提(tí)取画面(miàn)的构(gòu)图，人物的姿(zī)势和画面的深度信息等。有了它(tā)的帮助，就(jiù)不(bù)用频繁的(de)用提示(shì)词来碰运气，抽盲盒式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了“魔(mó)法”，不少(shǎo)博主(zhǔ)的作品(pǐn)已(yǐ)经获(huò)得了大量的浏览量，“viggo”就是其中之(zhī)一，他用朋友的照片直接(jiē)带她们走进动漫世界。

viggo先用(yòng)StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应的关(guān)键词；最后(hòu)用ControlNet插(chā)件绑定骨骼开始换关(guān)键词试效果。

通过图片就可以看出(chū)来，效果十分惊艳。

更厉害(hài)的是，除(chú)了真实的照片，草图也可以加上“魔(mó)法(fǎ)”，知(zhī)乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线稿转全彩图。大神(shén)张吕敏其本(běn)尊也亲(qīn)自回应。

不得不(bù)说当下AIGC已经变得(dé)越(yuè)来越(yuè)强大(dà)，甚至(zhì)输出的作品(pǐn)都已经能以假乱(luàn)真了。

难辨虚实(shí)，AIGC技(jì)术力爆发(fā)

警惕安全问题

近日，“苏州金鸡湖有游艇party”的(de)消息火(huǒ)遍(biàn)网(wǎng)络，而经过警(jǐng)方辟谣这所谓的(de)“party”可能是全(quán)国第一(yī)起AI绘(huì)图诈骗。

由于这个活(huó)动里面给出的(de)美(měi)女(nǚ)照片都是AI制(zhì)作(zuò)的真人照(zhào)片绘图，因为太逼真，被大(dà)家当(dāng)成真事(shì)传播了。

不过仔(zǎi)细观察(chá)可(kě)以发(fā)现，活动发起者提供的照片中有个很大的(de)漏洞可以发现并非真人，而是AI绘图，那(nà)便(biàn)是图片中女性的手(shǒu)指(zhǐ)部分有的存在异常。

ChatGPT之(zhī)后又一应用杀疯了，AIGC或进入可控期，将洗(xǐ)牌科(kē)技(jì)行业？_黑料正能量

有(yǒu)行业(yè)人事(shì)表示：“现在因(yīn)为手指部分的(de)绘画算法(fǎ)比(bǐ)较复(fù)杂，AI还不太会(huì)画人的(de)手，但最新看到(dào)的图片(piàn)已经有越来越完(wán)美的AI模(mó)型出现，以(yǐ)后(hòu)可能(néng)就完全没有(yǒu)漏洞了。”

类似的AI作图诈骗在国外也已有发生。据英(yīng)国(guó)广播公司(sī)报道，土(tǔ)耳其地震期间，有Tiktok用户使用AI合成(chéng)了儿童受灾(zāi)的(de)假照片发布到(dào)网络，以此诱骗善良(liáng)的人打(dǎ)赏“捐(juān)助”从而实施诈骗。

目(mù)前随着技(jì)术发展，AIGC已经能做出(chū)真人照(zhào)片般的绘图效果，如果这样(yàng)的图片被用来诈骗(piàn)，将非常可怕。

此外(wài)AIGC还引发了(le)很多担忧(yōu)，一方(fāng)面，批判者认为AI在“学习”了大量前(qián)人的作品之后，其创作没有任何情绪和灵魂，难以和(hé)人类(lèi)的艺术创作相提并论。

另一(yī)方面，AIGC背后(hòu)的版权、目前都并没有得(dé)到(dào)有效的解决，还有AIGC会不会代(dài)替人(rén)类“至高无上”的创意。

马斯(sī)克也强(qiáng)调，人(rén)工(gōng)智能的安(ān)全问题需要得(dé)到重视(shì)，太晚就(jiù)来不(bù)及了。

AIGC下一站除了视频(pín)，还有远方

技术都是(shì)有(yǒu)两面性的，潜在的(de)危害并不能掩盖其光辉的贡献。现(xiàn)在(zài)看来，人工(gōng)智能技术(shù)将是第四次工业(yè)革(gé)命的核心驱(qū)动力量，将创造新的增长奇迹。

过去一年(nián)，人(rén)工智能(néng)在技术和商业层面都有了巨大进(jìn)展，AI绘画就是人(rén)工智能技术发生方向性改变的一个代表。其下一站或(huò)许(xǔ)就是视频。

此前，Meta和谷(gǔ)歌先后发(fā)布(bù)了几条引爆科技圈的短(duǎn)视频(pín)。这些视频引发关注并非(fēi)内容做得多优秀，反而都非(fēi)常简单(dān)，比如(rú)一匹正在(zài)喝(hē)水的马，一只画(huà)画的玩具熊，或者一(yī)段骑(qí)摩托车的第(dì)一(yī)视角录(lù)像，随(suí)便一(yī)个有手机的人都(dōu)可以随手录下(xià)一段(duàn)。

但这些短视频的(de)创作(zuò)方式非常简单，创(chuàng)作者仅(jǐn)仅需要向AI输入一段(duàn)话(huà)，甚(shèn)至只是说(shuō)一下要(yào)求，AI就可以根(gēn)据(jù)需(xū)要(yào)生成一(yī)段视频。

谷歌发布的两个AI生成视频分别来自于Imagen Video和Phenaki，前者主要(yào)突出的是(shì)高清(qīng)，与Meta的Make-A-Video没有太(tài)多的差别(bié)。

在Make-A-Video公布了AI生成的视频后(hòu)，AI圈就已经玩(wán)了一波梗，一(yī)个能够做出更高(gāo)清视频的AI还不(bù)足以在短时间(jiān)内(nèi)戳中兴奋(fèn)点。

Phenaki更加令人震惊(jīng)的地方(fāng)在于，它可以制作(zuò)出超过2分钟(zhōng)的连贯的(de)也有确切内容的视频，这才是真正让人们感到惊喜的(de)地方。因(yīn)为(wèi)无论AI生(shēng)成(chéng)的视频多么高清(qīng)，也只能(néng)是为内容(róng)生产者(zhě)提供一个灵感，一个素材，一个过场动画。

不(bù)过能够制(zhì)作出有具体剧情内(nèi)容的视频就意味着，一些视频创作由AI代替人工(gōng)完成已经初步有了可能。

当下AI的发展速度已(yǐ)经(jīng)超过大(dà)部分人的(de)想象。内容产(chǎn)业(yè)的本质(zhì)是供给创造需求(qiú)，AIGC作为全新的(de)内容生产方式，可(kě)以(yǐ)为内容产业带来更新的(de)内容风格、更快(kuài)的生产速度(dù)，更(gèng)低的生产成(chéng)本，这无(wú)疑(yí)会驱动内容(róng)产业的大爆发。

除了(le)AI绘图、视(shì)频，AIGC技术(shù)还能应用(yòng)于音乐(lè)、代码、机器人(rén)动作等多种内容形式的生成。不难发(fā)现该(gāi)项技术不仅(jǐn)在游戏等(děng)行业能得到(dào)有(yǒu)效(xiào)应(yīng)用，对于下(xià)一代互联网各种元素的(de)构(gòu)建亦有关键(jiàn)意(yì)义。

从商业化的角(jiǎo)度(dù)来看，文化娱(yú)乐、教育、传媒等诸多领(lǐng)域，本身就对基于AI的可视(shì)化内容有强烈需求。

因此，AI绘画及视(shì)频或不是结果，而只是AI进(jìn)程中的一块重要拼图，有望(wàng)在技术(shù)更新的(de)加持下实现更大的应用价值。

AI从理解(jiě)内容，走(zǒu)向了可以生成内容(róng)，甚至能(néng)够创(chuàng)造出独(dú)立价值和独(dú)立视角的内容。AIGC的(de)再次出圈，更(gèng)代(dài)表(biǎo)着未来的先进生产力(lì)即将到来。

紧抓大模型(xíng)与算(suàn)力，牢固AIGC底(dǐ)座

从(cóng)技术(shù)的发展也(yě)可(kě)以看出，在(zài)语言(yán)大模型、图(tú)像大模型之后，多(duō)模态(tài)大(dà)模(mó)型已经成(chéng)为了新(xīn)的趋势(shì)。

大(dà)模型被(bèi)誉为当前人工智能(néng)发展(zhǎn)的智(zhì)能底座，是全球竞争最激烈(liè)的研(yán)究方向(xiàng)之一，包括谷歌、亚马逊、百度、阿(ā)里、腾讯(xùn)等众多头部企业都在(zài)竞相发(fā)力。

不过训(xùn)练(liàn)大模型的确价格不菲，以国盛证(zhèng)券(quàn)发布的(de)《ChatGPT需要多少(shǎo)算力》报告(gào)估算，GPT-3训练一次的成本约为(wèi)140万(wàn)美(měi)元。而对于(yú)一些更大的LLM(大(dà)型语言模(mó)型(xíng))，训(xùn)练(liàn)成本则介(jiè)于200万美元至1200万美(měi)元高价之(zhī)间。

以(yǐ)ChatGPT在2023年(nián)1月的独立访(fǎng)客(kè)平均(jūn)数(shù)1300万计(jì)算，其对应(yīng)芯(xīn)片需求(qiú)为3万(wàn)多(duō)片(piàn)英伟(wěi)达A100 GPU，初始投入成(chéng)本约为(wèi)8亿(yì)美元(yuán)，每日仅电费就在5万美元左右。

此外不论(lùn)是ChatGPT还是AIGC，都离不(bù)开庞大算力支持。在关注各(gè)类大模型的发展同时(shí)，更(gèng)应该关注(zhù)算力(lì)网络的建设。

算力网络正驱动(dòng)AI产业发(fā)展进(jìn)入史诗(shī)级加速进程(chéng)，让(ràng)AIGC及通用AI这(zhè)一人(rén)工智能(néng)发展的终极(jí)目标离(lí)得更(gèng)近。

因为算力可(kě)以对突破性(xìng)技(jì)术创(chuàng)新提(tí)供(gōng)大力的支持。这方面，多(duō)模态大模型(xíng)是典型。作为面(miàn)向(xiàng)未来强人工智能、通(tōng)用人工(gōng)智能的重要技术创新，多模态大模型(xíng)已经(jīng)在人工(gōng)智能(néng)领(lǐng)域(yù)提出了很多年，业界也有不(bù)少技术突破，但是，多(duō)模态大模型进一步往下(xià)走(zǒu)，算力需(xū)求(qiú)呈几何式(shì)上升(shēng)，一(yī)般(bān)的算力基础设施很快将难以(yǐ)胜任。

从图(tú)像、文字、语音单(dān)独一项的训练，到双(shuāng)模态、三模态的(de)跃迁，让人工(gōng)智能(néng)可(kě)以灵活应对不(bù)同(tóng)模态的转(zhuǎn)化、像人(rén)与世界交(jiāo)互一样自然，这方面，由算(suàn)力网络来驱动将有明(míng)显优(yōu)势。