尽管的关联词后面是什么，尽管的关联词表示什么关系-橘子百科-橘子都知道

尽管的关联词后面是什么，尽管的关联词表示什么关系 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天机器人ChatGPT火(huǒ)爆以(yǐ)来，微软公司创始人比尔(ěr)·盖茨已多次公开谈论人(rén)工智能话题。在最近的一次采(cǎi)访中，他(tā)再次表示：“AI可(kě)能会让科技行业(yè)迎来(lái)一(yī)次(cì)剧烈的洗(xǐ)牌”。

这个(gè)结论是(shì)他在当地(dì)时间2月20日接受(shòu)《In Good Company》节目专访时提出的(de)。

他预期，AI的发展(zhǎn)可能会威胁(xié)到谷歌的市占(zhàn)率，因为微软(ruǎn)在AI方面的(de)行动相当(dāng)迅速。而最(zuì)终(zhōng)科技巨头(tóu)将(jiāng)把AI整合成(chéng)用户的(de)“全能助手”，包揽一切(qiè)应用，与人们进行沟(gōu)通并提供建(jiàn)议(yì)，可以(yǐ)取代(dài)亚马逊(xùn)、Siri或Outlook等(děng)应用。

大佬口中全能助手(shǒu)的到来可(kě)能(néng)尚需时日，但由ControlNet引发的又一(yī)次AI绘画浪(làng)潮(cháo)，让AIGC在ChatGPT的话题热点(diǎn)包围中杀(shā)出重围。

ChatGPT之后又一应用(yòng)杀疯了，AIGC或进(jìn)入可控期(qī)，将(jiāng)洗牌科技行业(yè)？_黑(hēi)料正能量

ControlNet颠覆(fù)AI绘画(huà)新玩法(fǎ)

AIGC向可控靠近

以AI绘(huì)画为(wèi)代表的(de)AIGC上一次爆火的时(shí)候(hòu)，还(hái)是(shì)2022年8月，在美国科罗拉(lā)多州举(jǔ)办的新兴数字艺术家竞赛(sài)中，一幅(fú)名为(wèi)《太空歌剧(jù)院》的(de)作品获奖。

随后(hòu)各大厂商的AI绘画软(ruǎn)件被广大网友(yǒu)熟(shú)知并体验(yàn)，Stable Diffusion便是其中(zhōng)代表。

用户们可(kě)以在应用中输入一组关键词或者一张照(zhào)片，就能获得(dé)一幅AI创作的画作。

作画的关(guān)键就是(shì)所输入的文(wén)本。同(tóng)一组关键词也可(kě)以创作出很多张风(fēng)格不一样的画(huà)作，这(zhè)让创(chuàng)作的过程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这(zhè)种不确定的惊喜(xǐ)，他们(men)会将生成的(de)美(měi)图当做头像。而另一部分喜欢翻看AI绘画(huà)的“翻(fān)车”作品。在社(shè)交媒体(tǐ)上，许多用户(hù)分享AI“翻车现场”，例如，一位网友(yǒu)的小狗照片被AI画成了“肌(jī)肉男”，还(hái)有(yǒu)网友(yǒu)的个(gè)人(rén)照片(piàn)被AI识别成了(le)建(jiàn)筑。

而如今随着ControlNet的出现(xiàn)与(yǔ)加持(chí)，以往AI绘(huì)画的(de)填写关(guān)键词(cí)游戏可能要被(bèi)颠覆了。

ControlNet是一位正在(zài)斯(sī)坦福读博的中国(guó)人张(zhāng)吕敏创(chuàng)作的一种基于控制点的图(tú)像(xiàng)变形算法，主要用于数字图像(xiàng)处理、计(jì)算(尽管的关联词后面是什么，尽管的关联词表示什么关系suàn)机视觉(jué)和计算机图形学等领(lǐng)域。

其SD插件一经(jīng)发布，在(zài)短(duǎn)短的(de)两(liǎng)天(tiān)内便成(chéng)为(wèi)了AI绘画领域最新(xīn)的(de)热点。

在此之(zhī)前，大家用了很多方法想(xiǎng)让AI生(shēng)成的结果尽可能的符合要求，但(dàn)是都不尽如人意，它的出(chū)现代表(biǎo)着(zhe)AI生成开始进(jìn)入真(zhēn)正(zhèng)的可(kě)控时期。

因为ControlNet可以直接提取画面的构图，人物的姿(zī)势和画面的深度(dù)信(xìn)息等。有了它的帮助(zhù)，就不用频(pín)繁的用(yòng)提示词来碰运气，抽盲盒式的创作了(le)。

通(tōng)俗的(de)说(shuō)ControlNet相(xiāng)当于给AI绘画加(jiā)了(le)“魔法”，不(bù)少(shǎo)博主的作品(pǐn)已经(jīng)获(huò)得了大量的浏览量，“viggo”就是其中(zhōng)之一，他(tā)用朋友的照片直接带她们走进动漫世界(jiè)。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键(jiàn)词；最(zuì)后用ControlNet插件绑(bǎng)定骨骼开始换关键词试效果。

通过图(tú)片(piàn)就可以(yǐ)看出来(lái)，效果十分惊艳。

更(gèng)厉害(hài)的(de)是，除了(le)真实的照片(piàn)，草图(tú)也可以加上“魔法”，知乎(hū)大牛(niú)“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线稿转(zhuǎn)全彩图。大神(shén)张吕(lǚ)敏其本尊也(yě)亲自回应(yīng)。

不得不说当(dāng)下AIGC已经(jīng)变(biàn)得越来越强大，甚至(zhì)输(shū)出(chū)的作品都已经(jīng)能以假乱真了。

难辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州金鸡(jī)湖有游艇(tǐng)party”的消息火遍网络(luò)，而经过警方辟谣这(zhè)所谓的“party”可能(néng)是全国第一起AI绘(huì)图诈骗(piàn)。

由(yóu)于这(zhè)个活(huó)动里面给出的美女照片都是AI制(zhì)作的真人(rén)照片绘图，因为太逼真，被大家当成真事(shì)传播了。

不过仔细观察可以发现，活动发(fā)起(qǐ)者提供的(de)照片中(zhōng)有个很(hěn)大的漏洞可以发现(xiàn)并非(fēi)真人(rén)，而是AI绘图，那便是图片中女性的手(shǒu)指部分有的存在异(yì)常。

ChatGPT之后又一应用杀疯了，AIGC或进入可控(kòng)期，将洗牌科技(jì)行业？_黑料正(zhèng)能量

有行业人事表(biǎo)示：“现(xiàn)在因为手指部分的绘(huì)画(huà)算法比(bǐ)较复杂(zá)，AI还不太(tài)会画(huà)人的手，但(dàn)最(zuì)新看到的图片已经有越来越完美的(de)AI模(mó)型出(chū)现，以后可能就完全(quán)没有漏洞(dòng)了。”

类(lèi)似的(de)AI作图(tú)诈骗在国外也已有发生(shēng)。据英(yīng)国(guó)广播公司报(bào)道，土耳其地震期间(jiān)，有Tiktok用户使用AI合(hé)成了儿(ér)童受灾(zāi)的(de)假照片发(fā)布(bù)到网络，以此诱骗(piàn)善良的人打赏“捐助”从(cóng)而(ér)实施诈骗。

目(mù)前随着技术发(fā)展，AIGC已经能做(zuò)出真人照(zhào)片般的绘图效果，如果(guǒ)这样的图片被用来诈骗，将非(fēi)常可怕(pà)。

此外AIGC还(hái)引发了很多担忧，一方面，批判者(zhě)认为(wèi)AI在“学(xué)习”了大量(liàng)前人的作品之(zhī)后，其创作没有任何情绪和灵(líng)魂，难以和人类的艺(yì)术(shù)创作(zuò)相提(tí)并(bìng)论。

另一方(fāng)面，AIGC背(bèi)后的版权、目(mù)前都并没有得到有效(xiào)的解决(jué)，还有AIGC会不会代替人类“至高无(wú)上”的创意。

马斯克也强调(diào)，人(rén)工(gōng)智能的安全问题需要得到(dào)重视(shì)，太晚(wǎn)就来不及(jí)了。

AIGC下一站(zhàn)除了视频，还(hái)有(yǒu)远方

技(jì)术都(dōu)是(shì)有(yǒu)两面性的，潜在(zài)的危害并不(bù)能(néng)掩盖其光辉的贡献。现在看来，人工智能技术(shù)将是第四次(cì)工业革命的核心驱动力量，将(jiāng)创造新的增长奇迹(jì)。

过去一年，人工智能(néng)在技(jì)术和商业层(céng)面都有了(le)巨大进展，AI绘画就是(shì)人工(gōng)智能技术发生方向性改变的一个代表。其下一站或(huò)许就是视(shì)频。

此前，Meta和谷歌(gē)先后发(fā)布了几条引(yǐn)爆科技圈的短(duǎn)视频。这些视(shì)频引(yǐn)发关注并非内容做得多优秀，反而都非常简单，比(bǐ)如一匹正在喝水的(de)马，一只画画(huà)的玩(wán)具熊，或者一段骑摩托车的(de)第(dì)一视(shì)角录像，随便一(yī)个有手机的人都可以(yǐ)随手(shǒu)录下一段(duàn)。

但这些短视频的(de)创作(zuò)方(fāng)式非常简单，创(chuàng)作(zuò)者仅仅需(xū)要向AI输入一段话，甚至(zhì)只是(shì)说(shuō)一下要(yào)求(qiú)，AI就可以(yǐ)根据需要生成(chéng)一段视频。

谷(gǔ)歌发布的两个AI生(shēng)成视(shì)频(pín)分别来自(zì)于Imagen Video和(hé)Phenaki，前者主要(yào)突出(chū)的(de)是高清(qīng)，与Meta的(de)Make-A-Video没有太多(duō)的差别(bié)。

在Make-A-Video公(gōng)布了AI生(shēng)成的(de)视频后，AI圈就(jiù)已经玩了一波梗，一个能够(gòu)做出(chū)更高(gāo)清视频的AI还(hái)不足(zú)以在短(duǎn)时(shí)间内戳中(zhōng)兴奋(fèn)点(diǎn)。

Phenaki更加令人(rén)震惊(jīng)的地方在于，它可以制作出超过(guò)2分钟的连贯的也有确切内容(róng)的视频，这才是真正让人们感(gǎn)到惊喜的地方(fāng)。因为(wèi)无论AI生成的视频(pín)多么高清(qīng)，也只能是为内容生(shēng)产者提供一(yī)个灵感，一(yī)个素材，一个过场动画。

不(bù)过(guò)能够(gòu)制作出有具体(tǐ)剧情(qíng)内容的视(shì)频就(jiù)意味(wèi)着，一(yī)些视频(pín)创作(zuò)由AI代替(tì)人工完成已经初步有(yǒu)了(le)可能。

当下AI的(de)发(fā)展速度已经超过大(dà)部分人的想(xiǎng)象。内(nèi)容产业的本质是供给创造需求，AIGC作为全新的(de)内容生(shēng)产方(fāng)式，可以(yǐ)为内容产(chǎn)业带来更新的内容风格、更快的生产速度，更低的生产成本，这(zhè)无疑会驱动内容产业的大爆(bào)发。

除了AI绘(huì)图、视(shì)频(pín)，AIGC技术还能(néng)应用(yòng)于音乐、代码、机器人动作等多种(zhǒng)内(nèi)容(róng)形式(shì)的生成。不(bù)难发现(xiàn)该项技术不仅在游戏等(děng)行业能(néng)得到(dào)有效(xiào)应用，对于下一代(dài)互联网各种元(yuán)素的构(gòu)建亦有关键意义。

从(cóng)商业化的角(jiǎo)度来看，文化娱乐、教育、传媒等诸多领域，本身就(jiù)对基于(yú)AI的可视(shì)化内容有强烈需(xū)求(qiú)。

因此，AI绘画(huà)及(jí)视(shì)频或不是(shì)结果，而只是AI进程中(zhōng)的(de)一(yī)块重要拼图(tú)，有望在技(jì)术更新的加持下实现更大的应用价值。

AI从(cóng)理解内容，走(zǒu)向了可以生成内容，甚至能够(gòu)创(chuàng)造(zào)出独立价值和(hé)独立视角的内容。AIGC的再次出圈，更(gèng)代表着未(wèi)来的先进生产力(lì)即将到来。

紧抓大模型与算力，牢(láo)固AIGC底座

从(cóng)技术的发展也可以看出，在语言大模型、图像(xiàng)大模型(xíng)之后，多(duō)模(mó)态大模型已经成为了(le)新的(de)趋(qū)势。

大模(mó)型被誉为(wèi)当前人工智能发展的(de)智能底座(zuò)，是全球竞争最激烈的(de)研究方向之(zhī)一，包括谷歌(gē)、亚马逊、百度(dù)、阿里、腾讯等众(zhòng)多头部(bù)企业(yè)都在竞相发(fā)力。

不过训练大(dà)模型的确价格不菲，以国盛(shèng)证券发布的(de)《ChatGPT需要多少算(suàn)力》报告估(gū)算，GPT-3训练一次的成本约为140万美元。而对于一些更大的LLM(大型语言模(mó)型)，训(xùn)练成本则介(jiè)于(yú)200万(wàn)美元(yuán)至(zhì)1200万美元高价之间。

以ChatGPT在2023年1月的独(dú)立访客平均数1300万计算，其对(duì)应芯片需(xū)求为3万多片(piàn)英(yīng)伟达A100 GPU，初(chū)始投入成本约(yuē)为8亿(yì)美元，每(měi)日仅电费就在5万美(měi)元左(zuǒ)右。

此外不论是ChatGPT还是AIGC，都(dōu)离不开(kāi)庞大算力支(zhī)持。在关注各类大模(mó)型的(de)发展(zhǎn)同(tóng)时(shí)，更应该关注算力(lì)网络的建(jiàn)设。

算力(lì)网络正驱动AI产业发展进入史诗级(jí)加速进程，让AIGC及(jí)通用AI这一人工(gōng)智能(néng)发展的终极(jí)目标离得更近。

因(yīn)为算力可以对(duì)突(tū)破性(xìng)技术创(chuàng)新提供大力的支持(chí)。这方面，多模态(tài)大模型(xíng)是典型。作(zuò)为面向未来(lái)强人工智能、通用人工智能的重要技术创新，多模态大模(mó)型已(yǐ)经(jīng)在人工智(zhì)能领域(yù)提出了很多年，业界也有不少技术突破，但是(shì)，多(duō)模态大模型进一步往(wǎng)下走(zǒu)，算力需(xū)求呈几何式上升，一般的算力基础(chǔ)设施很(hěn)快将难以胜任。

从图像、文字、语(yǔ)音(yīn)单(dān)独一项的训练，到双模态、三模态的跃迁(qiān)，让人(rén)工智能可以灵活应对不同(tóng)模态的转化、像人与世界交互一样自(zì)然(rán)，这(zhè)方面，由算(suàn)力网络来驱(qū)动将有明显优势。