橘子百科-橘子都知道橘子百科-橘子都知道

观摩和观看的区别和联系,观摩和观看的区别在哪

观摩和观看的区别和联系,观摩和观看的区别在哪 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机器人(rén)ChatGPT火爆以来,微软公(gōng)司创始人比尔(ěr)·盖茨已多次公开谈论人工智能话题。在最近的一次采访中,他再(zài)次表(biǎo)示:“AI可能会让(ràng)科技行(xíng)业迎来一次剧烈的洗牌(pái)”。

这个(gè)结论(lùn)是他在(zài)当地时间2月(yuè)20日(rì)接受《In Good Company》节目(mù)专访时提出的(de)。

他(tā)预期,AI的发展可(kě)能会威胁到谷歌的市占率(lǜ),因为微(wēi)软在(zài)AI方面的行动(dòng)相当(dāng)迅速。而最(zuì)终科技巨头将(jiāng)把AI整合成(chéng)用户的“全能助手(shǒu)”,包揽一切应用,与人(rén)们(men)进(jìn)行沟通并提供建议(yì),可以取代亚马逊、Siri或Outlook等(děng)应用。

大(dà)佬口中全能助手的到来可能(néng)尚(shàng)需(xū)时日,但由ControlNet引发的又一次AI绘(huì)画浪潮(cháo),让AIGC在ChatGPT的话题热点包围中(zhōng)杀出重围。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科技行业?_黑料正能(néng)量

01

ControlNet颠(diān)覆(fù)AI绘画新(xīn)玩法

AIGC向可控(kòng)靠近

以AI绘画为(wèi)代表的AIGC上一次爆火的时候,还是2022年8月,在美国科罗拉多(duō)州(zhōu)举办的新兴(xīng)数字艺(yì)术家竞赛中(zhōng),一幅名为《太空歌剧院》的作品获奖。

随后各(gè)大厂商的AI绘画软件被广大(dà)网友熟知(zhī)并体验,Stable Diffusion便是其中代表。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或(huò)进(jìn)入(rù)可(kě)控期(qī),将洗牌科技行业(yè)?_黑(hēi)料正能(néng)量

用户们可以在应用(yòng)中输入一组关键词或者一张(zhāng)照片,就观摩和观看的区别和联系,观摩和观看的区别在哪能获得一幅AI创作的画作(zuò)。

作画的关键就(jiù)是所输入的文本。同一组关键词也可以创作(zuò)出很多张风格不一样(yàng)的画作,这让创作的过程(chéng)就像开盲盒。

很多用(yòng)户很喜欢这种不确定的(de)惊喜,他们会(huì)将(jiāng)生成(chéng)的美图当做头像。而另(lìng)一部分喜欢翻看(kàn)AI绘画的“翻车”作品。在(zài)社(shè)交(jiāo)媒体上,许(xǔ)多(duō)用户分享(xiǎng)AI“翻车现场”,例如,一位网友的小狗照片被(bèi)AI画成了“肌肉男”,还有网友的个人照片被AI识(shí)别成(chéng)了建筑。

而(ér)如(rú)今随着ControlNet的出现(xiàn)与(yǔ)加持,以往AI绘画的填写(xiě)关键词游戏可(kě)能(néng)要被(bèi)颠覆了。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或进(jìn)入可控期,将洗牌科(kē)技(jì)行业?_黑(hēi)料正能量

ControlNet是一位正在斯坦福读博的中国人张吕敏创作的一种基于控制点的(de)图(tú)像变形算(suàn)法,主要用(yòng)于数(shù)字图(tú)像处理、计(jì)算(suàn)机视(shì)觉(jué)和计算机图形学等领域(yù)。

其SD插件一经发布,在短短的两天内便成为了AI绘(huì)画领域(yù)最(zuì)新的热点。

在此之前,大家用了(le)很多方法想让AI生(shēng)成的(de)结果尽可能的符合要求,但是都不(bù)尽如人意,它的(de)出(chū)现代表着AI生成开始(shǐ)进入真正的可控时期。

因(yīn)为ControlNet可以直接提取画面的构图,人物的姿势和画面的(de)深度信(xìn)息等。有了它的帮(bāng)助,就不用频繁的用提示词来碰(pèng)运(yùn)气(qì),抽盲盒式的(de)创作了。

通(tōng)俗的说ControlNet相当于(yú)给(gěi)AI绘(huì)画加了“魔法”,不少(shǎo)博(bó)主(zhǔ)的作品已(yǐ)经获得了大量的浏览(lǎn)量(liàng),“viggo”就是其(qí)中之一,他用朋友的(de)照片直(zhí)接带她(tā)们走进动漫世界。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

viggo先用StableDiffusion图片(piàn)转文字。

再(zài)用Text2Prompt插件拓展找到对应的关键词(cí);最后用ControlNet插件绑定骨骼(gé)开始换关键词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入(rù)可控期,将(jiāng)洗牌科(kē)技行业?_黑料(liào)正(zhèng)能量

通过图片就可以看出来,效果十分惊(jīng)艳。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或(huò)进入(rù)可控期,将洗牌科技(jì)行业?_黑料正能(néng)量

ChatGPT之后(hòu)又一(yī)应用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

更厉(lì)害的是,除了真实(shí)的照片(piàn),草(cǎo)图也可以加上(shàng)“魔法”,知(zhī)乎大牛(niú)“DevPoint”和“逗砂”介(jiè)绍到ControlNet还(hái)能(néng)实现线稿转全(quán)彩(cǎi)图。大神张吕敏其本(běn)尊(zūn)也(yě)亲自回应。

ChatGPT之后(hòu)又一应(yīng)用杀疯了(le),AIGC或进入(rù)可控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

不得不说当下AIGC已经变得越来(lái)越强大(dà),甚至输出的作品(pǐn)都已经能(néng)以假乱真了。

02

难辨虚实(shí),AIGC技(jì)术力爆发

警惕安(ān)全问题

近日,“苏州金鸡湖有(yǒu)游艇(tǐng)party”的消(xiāo)息火遍(biàn)网络,而经过警方辟谣(yáo)这所谓(wèi)的“party”可(kě)能是全国(guó)第一起(qǐ)AI绘图诈(zhà)骗。

由于(yú)这个活动里面给出(chū)的美(měi)女照片(piàn)都是AI制作(zuò)的(de)真(zhēn)人照片绘图,因为太逼(bī)真,被大家当成真事(shì)传播了

ChatGPT之后又(yòu)一应(yīng)用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑料(liào)正能(néng)量

不过仔细观察可以发现,活动发起者提供的照片中(zhōng)有(yǒu)个(gè)很大的漏(lòu)洞可以发现并非真人,而是AI绘图,那便是图(tú)片中女(nǚ)性的(de)手指部分有的存在异常。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料(liào)正能量

有行业人(rén)事(shì)表示:“现在(zài)因为手指部分的(de)绘画算法比较(jiào)复杂,AI还不太会画人的手,但最新看(kàn)到的图片已经(jīng)有越来越完美的AI模型出现,以(yǐ)后可能就(jiù)完全(quán)没有漏洞了。

类似的AI作图诈骗在(zài)国外也已有发生。据(jù)英国广播公司(sī)报道,土(tǔ)耳其地震期间,有Tiktok用(yòng)户使用AI合成了儿童(tóng)受灾的假照(zhào)片发(fā)布到网(wǎng)络,以此诱(yòu)骗(piàn)善良的人打赏“捐助”从而实(shí)施诈骗。

目(mù)前随着技术(shù)发展(zhǎn),AIGC已经能做出真人照片般的绘图效果,如(rú)果(guǒ)这样的图片被用来诈骗,将非(fēi)常可怕。

此外AIGC还引发了很多(duō)担忧(yōu),一(yī)方面(miàn),批判者认(rèn)为AI在“学习”了大量前人的作品(pǐn)之(zhī)后,其创(chuàng)作(zuò)没有(yǒu)任何情绪和灵魂(hún),难(nán)以和(hé)人类的艺术创作相提(tí)并(bìng)论。

另一(yī)方面,AIGC背后的版权、目前(qián)都并没有(yǒu)得到有(yǒu)效的解决(jué),还有(yǒu)AIGC会不会代替(tì)人(rén)类“至高无上”的创意。

马斯克也(yě)强调,人工智(zhì)能的安全(quán)问题需要得到重(zhòng)视,太晚(wǎn)就来不(bù)及了。

03

AIGC下一站除了(le)视频,还有远方

技术都是有两面性的,潜(qián)在的危害并不能掩盖其(qí)光辉的贡献。现在(zài)看来,人(rén)工智能技术将是第四次工业革命的核心驱动力量,将(jiāng)创(chuàng)造新的增长(zhǎng)奇迹。

过(guò)去(qù)一年(nián),人工智(zhì)能在技术和商业层面都有了(le)巨大进展(zhǎn),AI绘画就是人工智能技术(shù)发生方向性改变的(de)一个代(dài)表。其下(xià)一站或许就(jiù)是视频。

此(cǐ)前(qián),Meta和谷歌先后(hòu)发布了(le)几条引(yǐn)爆科(kē)技圈的(de)短视(shì)频。这(zhè)些视(shì)频引(yǐn)发关注并非内容做(zuò)得多(duō)优秀(xiù),反而都非常简单(dān),比如(rú)一匹正在喝水的马(mǎ),一(yī)只画画的玩具熊,或者一段(duàn)骑(qí)摩托车的(de)第一视角录像(xiàng),随便一(yī)个有手(shǒu)机的人都可以随手录下(xià)一段。

ChatGPT之(zhī)后又(yòu)一应用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗(xǐ)牌科(kē)技行业?_黑(hēi)料(liào)正(zhèng)能量

但这些短(duǎn)视频的创(chuàng)作方(fāng)式(shì)非(fēi)常简单,创作(zuò)者(zhě)仅仅需要(yào)向AI输入一段(duàn)话,甚(shèn)至(zhì)只是说(shuō)一(yī)下要(yào)求,AI就可以根据需要生(shēng)成一段视(shì)频。

谷(gǔ)歌发布的两个AI生成视频(pín)分别来自于Imagen Video和(hé)Phenaki,前者主(zhǔ)要突出的是高清,与(yǔ)Meta的Make-A-Video没有(yǒu)太多(duō)的差别。

在Make-A-Video公(gōng)布了AI生成的视(shì)频后,AI圈就已经玩了一波梗(gěng),一个能够做出(chū)更高(gāo)清视(shì)频的AI还不足以在短时间内(nèi)戳中(zhōng)兴奋点。

Phenaki更加令人震(zhèn)惊的地方(fāng)在于,它(tā)可以制作出(chū)超(chāo)过2分(fēn)钟的(de)连贯的(de)也有确切内容的视频,这才是(shì)真正让人(rén)们感(gǎn)到惊喜的地方。因为无(wú)论AI生成的视频多么高(gāo)清,也只能是为内容生产(chǎn)者提供一(yī)个灵感,一个素材(cái),一个(gè)过场(chǎng)动画。

不过能够制作出有具体剧情内容的视频就意味着,一些视频(pín)创作由AI代替人(rén)工完成已经初步(bù)有(yǒu)了可能。

当下AI的发展速(sù)度已经超过(guò)大部分(fēn)人的想象(xiàng)。内容产业(yè)的本质是供(gōng)给(gěi)创(chuàng)造需求,AIGC作为(wèi)全新的内容(róng)生产方(fāng)式,可以为(wèi)内(nèi)容产业带来(lái)更新的内容风格(gé)、更快的生产速度,更(gèng)低的(de)生产成本,这(zhè)无疑会驱动内容产业的大爆发。

除了AI绘(huì)图(tú)、视频(pín),AIGC技术(shù)还(hái)能(néng)应用于音乐、代码、机器人动(dòng)作等(děng)多种内容形式的生成。不难发现该项技术(shù)不仅在游戏等行业能得到有效(xiào)应(yīng)用,对(duì)于(yú)下(xià)一代互联网各种(zhǒng)元(yuán)素的(de)构建亦有关键意义(yì)。

从商(shāng)业化的(de)角度来看(kàn),文化娱(yú)乐、教育(yù)、传媒(méi)等诸多(duō)领域,本(běn)身就对基于AI的可视化(huà)内容有(yǒu)强(qiáng)烈需求。

因此,AI绘画及视频或不是(shì)结果,而(ér)只(zhǐ)是AI进程中的一块重要拼图,有望在技术更新的加(jiā)持下实现更大的应用价(jià)值。

AI从(cóng)理解内容,走向了可以生成(chéng)内容,甚至能够创造(zào)出(chū)独(dú)立价值和独立视角的内容。AIGC的再次出圈,更代表着未(wèi)来的先(xiān)进生产力即将到来。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料(liào)正能量

04

紧抓大模型与(yǔ)算力,牢(láo)固AIGC底座

从技(jì)术(shù)的发展(zhǎn)也可以看出,在语(yǔ)言大模(mó)型、图像大(dà)模(mó)型(xíng)之后,多(duō)模态大模型已经成为了新的趋势。

大模(mó)型(xíng)被誉为(wèi)当前(qián)人工智能发(fā)展的智能(néng)底座,是全球(qiú)竞(jìng)争最(zuì)激烈的(de)研究方向(xiàng)之一,包括谷歌、亚马逊、百(bǎi)度(dù)、阿里、腾讯等众(zhòng)多头部企业都在竞相发力(lì)。

不过(guò)训练大模(mó)型的确价格(gé)不(bù)菲,以国盛证(zhèng)券发布的《ChatGPT需要多少算(suàn)力》报告估算(suàn),GPT-3训练一次的成本约为140万美(měi)元。而对于一些更大的LLM(大型语言模型),训练成本则(zé)介于200万美(měi)元至1200万美元高价之(zhī)间。

以ChatGPT在2023年1月的(de)独立访客(kè)平均数1300万计算,其对(duì)应(yīng)芯(xīn)片需(xū)求为3万多片英伟(wěi)达(dá)A100 GPU,初始(shǐ)投入成本(běn)约为8亿(yì)美元,每(měi)日仅电费就在5万美元左(zuǒ)右。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料(liào)正(zhèng)能量

此外不论(lùn)是(shì)ChatGPT还是AIGC,都(dōu)离不开(kāi)庞大算力支持。在关注各类大模型的发展同时,更应该(gāi)关注算力网(wǎng)络(luò)的建设。

算力网络正(zhèng)驱动(dòng)AI产业发展进入史诗级加速进程,让AIGC及通用AI这一人工(gōng)智(zhì)能发展的终极目标(biāo)离得更近(jìn)。

因为算力可以对突破性(xìng)技术(shù)创新提供大(dà)力的支(zhī)持。这方面,多(duō)模态大(dà)模(mó)型是典型(xíng)。作为面向未(wèi)来(lái)强(qiáng)人(rén)工智(zhì)能、通(tōng)用(yòng)人工智能的(de)重(zhòng)要技术创新,多模态(tài)大(dà)模型已经在人工智(zhì)能领域提(tí)出了很多年,业界也有不少技(jì)术突破,但(dàn)是,多模态(tài)大模型进一步往下走,算力需(xū)求呈(chéng)几何式上升(shēng),一般的算(suàn)力基础设施很快(kuài)将难以(yǐ)胜任。

从图像、文字(zì)、语(yǔ)音单独一项的训(xùn)练,到双模态(tài)、三模态的跃(yuè)迁,让人工(gōng)智能(néng)可以灵活应(yīng)对不(bù)同模态的转(zhuǎn)化(huà)、像人与世界交互(hù)一样自然(rán),这方(fāng)面,由算力(lì)网络(luò)来驱动将有明显优势。

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入(rù)可(kě)控(kòng)期,将(jiāng)洗牌科(kē)技行业?_黑料(liào)正能量

此(cǐ)外,还(hái)有很多需要爆发式增(zēng)长(zhǎng)的算力来支撑的技术创新(xīn),将在人工智能算力(lì)网络支撑下快速推进。

AIGC已经露出曙光,期(qī)待在大(dà)模型和大算力的支持下AIGC能(néng)持续颠覆内容(róng)生产的方式,将创造(zào)的边际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 观摩和观看的区别和联系,观摩和观看的区别在哪

评论

5+2=