橘子百科-橘子都知道橘子百科-橘子都知道

兔子有几条腿,兔子有几条腿正确答案

兔子有几条腿,兔子有几条腿正确答案 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆(bào)以来,微软公司创始人(rén)比尔·盖茨已多(duō)次公(gōng)开谈(tán)论人工智能话题。在最(zuì)近的(de)一次采访中,他再次(cì)表示(shì):“AI可能会让(ràng)科(kē)技(jì)行业迎来一次剧(jù)烈(liè)的洗牌”。

这(zhè)个结论(lùn)是他(tā)在当地时间2月20日(rì)接受(shòu)《In Good Company》节(jié)目专访(fǎng)时提出的。

他预期,AI的(de)发展可能会威胁到谷歌(gē)的市占率,因(yīn)为微软在AI方面的行(xíng)动相当迅(xùn)速。而最终科技巨头将把AI整合成(chéng)用(yòng)户的“全能助手”,包揽一切(qiè)应用(yòng),与人们(men)进行沟通并提供(gōng)建议,可以取代亚(yà)马(mǎ)逊、Siri或(huò)Outlook等应用。

大佬口中全能(néng)助手的到(dào)来可能尚需时日,但由ControlNet引发的又一次AI绘画(huà)浪潮,让AIGC在ChatGPT的(de)话(huà)题热点包围中杀出重围。

ChatGPT之后又一应用(yòng)<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>兔子有几条腿,兔子有几条腿正确答案</span></span>杀疯(fēng)了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘画(huà)新(xīn)玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的(de)时(shí)候,还(hái)是2022年8月,在美国科罗拉多州举办的新(xīn)兴数字艺术(shù)家竞赛中,一幅名(míng)为《太空歌剧院》的作品获奖。

随后各大厂(chǎng)商的AI绘画软件被广(guǎng)大网友熟知并体验,Stable Diffusion便是其中代表。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科技行业(yè)?_黑(hēi)料正(zhèng)能量

用户们可以在(zài)应用(yòng)中(zhōng)输(shū)入一组关键词或(huò)者一张照片,就能获得一(yī)幅AI创作的画作。

作画的(de)关键就是(shì)所输入的文本。同一组关键词也可以(yǐ)创作出很多张风格不(bù)一(yī)样的画作(zuò),这让创(chuàng)作(zuò)的过(guò)程就像开盲盒。

很多用户很喜(xǐ)欢这种(zhǒng)不(bù)确定的惊(jīng)喜,他们会将(jiāng)生成的美图当做头(tóu)像。而另一部分喜欢翻(fān)看AI绘画的(de)“翻车”作品(pǐn)。在社交媒体上,许多用(yòng)户分享AI“翻(fān)车现场”,例如,一(yī)位网(wǎng)友的小狗(gǒu)照(zhào)片被(bèi)AI画成了“肌(jī)肉男”,还有网友的个(gè)人照(zhào)片被AI识别(bié)成了建筑。

而如今随着ControlNet的出(chū)现与加持,以往AI绘画的填写关键词游戏可能要被颠覆了。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯了,AIGC或进(jìn)入(rù)可控期(qī),将(jiāng)洗牌科(kē)技行(xíng)业?_黑料正能量

ControlNet是一位正(zhèng)在斯坦福读博的(de)中国人张吕敏创作的一种基于控制点(diǎn)的图像变形算法(fǎ),主要用于(yú)数字图像处理、计算机视觉和(hé)计算机图形学等领域。

其SD插(chā)件一经发布(bù),在短短的(de)两天内(nèi)便成为(wèi)了AI绘画领域(yù)最新的热点。

在此之前,大家(jiā)用了很多方法想(xiǎng)让AI生(shēng)成的结果尽可能(néng)的符合要求,但是(shì)都不(bù)尽如(rú)人(rén)意,它的出现代表着(zhe)AI生成开始进入真正的(de)可(kě)控(kòng)时(shí)期。

因为ControlNet可(kě)以直接提取画面的构图(tú),人物的姿(zī)势和画面的深度(dù)信息(xī)等。有了(le)它(tā)的帮(bāng)助,就不(bù)用频繁的(de)用提示词来(lái)碰(pèng)运气,抽盲盒式(shì)的创作(zuò)了。

通俗的说(shuō)ControlNet相当于给AI绘(huì)画加了“魔(mó)法”,不少博主的(de)作品(pǐn)已经获得了(le)大量的浏览量,“viggo”就(jiù)是其(qí)中之一(yī),他用朋友(yǒu)的(de)照(zhào)片直接带(dài)她们走进(jìn)动漫世界。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业?_黑料正(zhèng)能量(liàng)

viggo先用StableDiffusion图片转(zhuǎn)文字。

再用Text2Prompt插件拓展(zhǎn)找到对(duì)应的关键词(cí);最(zuì)后用ControlNet插件绑定骨骼开始换关(guān)键词试效果。

ChatGPT之(zhī)后(hòu)又一应用杀疯(fēng)了,AIGC或进入可(kě)控(kòng)期,将洗牌(pái)科技行业?_黑料正能量

通过图片就可以看出(chū)来(lái),效(xiào)果十分惊艳。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技(jì)行(xíng)业(yè)?_黑料(liào)正能量

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能(néng)量

更(gèng)厉害的是,除(chú)了(le)真实的(de)照片,草图(tú)也可以(yǐ)加上“魔(mó)法”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能(néng)实(shí)现线稿(gǎo)转全彩图。大神张吕敏其本尊也亲自回应。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能(néng)量

不得不说(shuō)当下AIGC已经变得(dé)越来越强大,甚至输出的(de)作品都已(yǐ)经(jīng)能以假乱真了。

02

难辨虚实,AIGC技术(shù)力爆发(fā)

警惕(tì)安全问题(tí)

近(jìn)日,“苏州金鸡湖有游艇party”的消息火(huǒ)遍网络,而经过(guò)警方辟(pì)谣这所谓的(de)“party”可能(néng)是全国第(dì)一起AI绘图诈骗(piàn)。

由于这个活动里面给出的美女照片都是(shì)AI制作的真人照片绘图,因为(wèi)太逼真,被大家当成真事传播了

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑(hēi)料正能量

不过仔细观察可以发现,活动发起者提供的照片中有个很大的漏洞可以发现并非真(zhēn)人,而是(shì)AI绘图,那便是图片(piàn)中女性的(de)手指部分有的存(cún)在(zài)异常(cháng)。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进(jìn)入可控(kòng)期(qī),将洗(xǐ)牌(pái)科技行业(yè)?_黑料正(zhèng)能(néng)量

有行(xíng)业人事表示:“现在因(yīn)为手(shǒu)指部分的绘画算(suàn)法比(bǐ)较复杂,AI还不太(tài)会画人的手,但最(zuì)新看(kàn)到的图片(piàn)已经有越来(lái)越完(wán)美(měi)的AI模型出现,以后可(kě)能(néng)就完全没(méi)有漏洞了。

类似的AI作图诈骗在(zài)国外也已有发(fā)生。据英(yīng)国广(guǎng)播公司报道,土耳(ěr)其地震期(qī)间,有Tiktok用户(hù)使用(yòng)AI合成了(le)儿童受灾的假照片发布到(dào)网(wǎng)络,以此诱骗善良(liáng)的(de)人打赏“捐助”从(cóng)而实施诈骗。

目前(qián)随(suí)着(zhe)技(jì)术(shù)发展,AIGC已经能做(zuò)出真人(rén)照(zhào)片般的(de)绘图效果(guǒ),如果这样的图(tú)片(piàn)被用来诈骗,将非(fēi)常可怕。

此(cǐ)外AIGC还(hái)引发了(le)很多担(dān)忧,一方面,批判者认为(wèi)AI在“学(xué)习”了(le)大量前人的作(zuò)品之(zhī)后(hòu),其创作没(méi)有(yǒu)任(rèn)何情(qíng)绪和灵魂,难以和人类的艺术创作相提并论(lùn)。

另(lìng)一方面,AIGC背后(hòu)的版权、目(mù)前都并没有得(dé)到有效(xiào)的解决(jué),还有AIGC会(huì)不会代替人类“至高无上”的创意。

马(mǎ)斯克也(yě)强调,人工智能的安(ān)全问题需要得到重视,太晚就来不及了。

03

AIGC下(xià)一站除了视频,还有远方

技术(shù)都是有两面性的,潜在的危(wēi)害并不(bù)能掩(yǎn)盖其光辉的(de)贡献。现在看来,人工智能技(jì)术将是(shì)第(dì)四次(cì)工业革命的核心驱(qū)动力量,将(jiāng)创造(zào)新(xīn)的增长奇迹。

过(guò)去一年,人工智能在技术和商业层面都有了巨大进展,AI绘画就(jiù)是人(rén)工智能(néng)技(jì)术发生方(fāng)向性改(gǎi)变的一个代表。其下一站或(huò)许就是视(shì)频(pín)。

此(cǐ)前,Meta和谷歌先后发(fā)布了几条引爆科技圈的(de)短视频。这些视频引(yǐn)发关注并非内容做得多优秀,反(fǎn)而都非常简(jiǎn)单,比如一(yī)匹(pǐ)正在喝水的马,一只画画的(de)玩具熊,或者一段(duàn)骑(qí)摩托(tuō)车(chē)的第一视(shì)角(jiǎo)录像,随便一个有手机(jī)的(de)人都可以随手录下一段。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将(jiāng)洗牌科技行业?_黑料正能(néng)量(liàng)兔子有几条腿,兔子有几条腿正确答案a-type="gif" data-w="256">

但这(zhè)些短视频(pín)的创作方(fāng)式非常简单,创作(zuò)者仅仅需要(yào)向AI输入(rù)一段话,甚至只是说一下(xià)要求,AI就可以根据需(xū)要生成一段(duàn)视频。

谷歌发布的(de)两个(gè)AI生成(chéng)视频(pín)分(fēn)别来自于Imagen Video和(hé)Phenaki,前(qián)者主要突出(chū)的(de)是高清(qīng),与(yǔ)Meta的Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布了AI生成(chéng)的(de)视频后,AI圈就已经玩了一(yī)波(bō)梗(gěng),一个能够做出更高(gāo)清视频的AI还不足以在短时间内戳(chuō)中兴奋点。

Phenaki更(gèng)加令人震惊的地方在于,它可以制作出超(chāo)过2分钟的连贯的也有(yǒu)确(què)切(qiè)内容的视频,这才(cái)是真正让人们感到惊喜的地方。因(yīn)为无(wú)论AI生成(chéng)的视频多么高清,也只(zhǐ)能是(shì)为内(nèi)容(róng)生产(chǎn)者(zhě)提供一个灵感,一个素材(cái),一(yī)个过(guò)场动画。

不过(guò)能够制作出有具体剧情内(nèi)容(róng)的视频就意味(wèi)着,一些视(shì)频创(chuàng)作由(yóu)AI代替人工完成(chéng)已经初步有(yǒu)了可能。

当下AI的(de)发展速度已经超(chāo)过大部分人的想象。内容产业的(de)本质是供给创造需求,AIGC作为全新的(de)内容(róng)生产方式,可以(yǐ)为内容产业带来更新的内(nèi)容风格、更快的(de)生产速度(dù),更低的生产成(chéng)本,这无疑会驱动(dòng)内容产业的大爆发(fā)。

除了AI绘图、视频,AIGC技术还能应用于音乐、代码、机器(qì)人动作(zuò)等多(duō)种(zhǒng)内容(róng)形(xíng)式的生成。不(bù)难发现该(gāi)项技术不仅在游戏(xì)等行业能得到有效应用,对(duì)于下一代互联网各种元素(sù)的(de)构建亦有关键意义。

从商业(yè)化的(de)角度来看,文化娱乐、教育、传媒等诸多领域,本(běn)身就对基于(yú)AI的(de)可(kě)视化内容有强烈需(xū)求。

因此,AI绘画及视频或(huò)不是结果,而只是AI进程中的(de)一(yī)块重(zhòng)要拼(pīn)图,有望(wàng)在(zài)技(jì)术(shù)更新的加持下(xià)实现更大的应用价(jià)值。

AI从理解内容,走向了可以(yǐ)生成内容,甚(shèn)至能够(gòu)创造出独立价(jià)值和独立视角的(de)内(nèi)容。AIGC的再次出圈,更代表着(zhe)未来的(de)先进生产力即将到(dào)来。

ChatGPT之(zhī)后又一应(yīng)用杀疯了(le),AIGC或进入(rù)可控期,将洗牌科技行业?_黑料(liào)正能量

04

紧抓大模型(xíng)与算力,牢固AIGC底座

从技术的(de)发展也可以(yǐ)看出,在语言大模型、图(tú)像大模型之后,多模态大模型已经(jīng)成为了新的(de)趋(qū)势。

大(dà)模型被誉为当前(qián)人工(gōng)智能(néng)发(fā)展的智能底座,是全球竞(jìng)争最激(jī)烈的研究方向之一,包括谷歌(gē)、亚马逊、百(bǎi)度、阿里、腾(téng)讯(xùn)等(děng)众多头(tóu)部企业(yè)都在竞相发力。

不过训练大模型的确(què)价格不菲(fēi),以国盛证券(quàn)发布的《ChatGPT需要多少(shǎo)算力》报告估(gū)算,GPT-3训练一(yī)次的成本(běn)约(yuē)为140万美(měi)元。而对于一(yī)些更大的LLM(大型语言模型(xíng)),训练(liàn)成本则介于200万美元至1200万美(měi)元高价之间。

以ChatGPT在2023年(nián)1月的独立访客平均数1300万计算(suàn),其对应芯片(piàn)需求(qiú)为3万多片(piàn)英伟(wěi)达A100 GPU,初始投入成本约为8亿美元,每日仅(jǐn)电费(fèi)就在5万(wàn)美元左右。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或进入(rù)可(kě)控期(qī),将洗(xǐ)牌科技行业?_黑料(liào)正能量

此(cǐ)外不论(lùn)是ChatGPT还是AIGC,都离不(bù)开(kāi)庞大(dà)算力(lì)支(zhī)持。在关(guān)注各类(lèi)大(dà)模型的发展同时(shí),更应该关注(zhù)算力网络的建设。

算力网络正驱(qū)动AI产业发(fā)展进入(rù)史诗级加速(sù)进程,让(ràng)AIGC及通用AI这(zhè)一人工智能发展的终极目标离得更近。

因为算力可以对突破性技术(shù)创新提供大力的支持。这方面,多模(mó)态大模(mó)型(xíng)是典型。作为面向未来强人工智能、通用人工智(zhì)能的重要技术创新,多模(mó)态大模型已经在人工智(zhì)能(néng)领域提(tí)出了很多年,业界也有不少技术(shù)突破,但是,多模态大(dà)模型进一步往(wǎng)下走,算力需求呈(chéng)几(jǐ)何式上升(shēng),一般(bān)的算(suàn)力基础设施很(hěn)快(kuài)将难以胜任(rèn)。

从图像、文字、语音单独一项的(de)训(xùn)练,到(dào)双模(mó)态、三模态的跃迁,让人工智能(néng)可以灵活应对不同模态的(de)转化(huà)、像人与世界交互一(yī)样自然(rán),这(zhè)方面,由算(suàn)力网络(luò)来驱动将有明显优势。

ChatGPT之(zhī)后又(yòu)一应用杀(shā)疯了(le),AIGC或进入(rù)可控(kòng)期,将洗牌科技行(xíng)业?_黑(hēi)料(liào)正能量

此外,还有很多需要爆发式增长的算力来支撑的技术创新,将在人工智能算力网络支撑下快(kuài)速推(tuī)进。

AIGC已经露出曙光,期待在大(dà)模型和大(dà)算力的支持(chí)下AIGC能持续颠覆内容(róng)生(shēng)产的方式,将创造的边(biān)际成(chéng)本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 兔子有几条腿,兔子有几条腿正确答案

评论

5+2=