橘子百科-橘子都知道橘子百科-橘子都知道

观摩和观看的区别和联系,观摩和观看的区别在哪

观摩和观看的区别和联系,观摩和观看的区别在哪 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人ChatGPT火爆(bào)以来,微软(ruǎn)公(gōng)司创(chuàng)始(shǐ)人比尔·盖茨已多(duō)次(cì)公开谈论人工智能话(huà)题。在最近的(de)一(yī)次采访(fǎng)中,他再次表示:“AI可能(néng)会让科技行业迎来(lái)一次剧(jù)烈的洗(xǐ)牌”。

这个(gè)结论(lùn)是他在当地时间2月20日(rì)接受《In Good Company》节目专访时提出(chū)的。

他预(yù)期,AI的发(fā)展(zhǎn)可能会威胁到谷歌的市占(zhàn)率,因为微软在AI方(fāng)面的行动相(xiāng)当迅(xùn)速。而(ér)最终科技巨(jù)头将把AI整(zhěng)合(hé)成(chéng)用户的“全能助手”,包揽一切(qiè)应用,与人们进行(xíng)沟通并提供建议,可以取(qǔ)代(dài)亚马逊、Siri或(huò)Outlook等应(yīng)用。

大佬口(kǒu)中全能助手的到来可能(néng)尚(shàng)需时日(rì),但由ControlNet引发的(de)又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话题热(rè)点包围中杀出(chū)重围。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌(pái)科技(jì)行业?_黑料(liào)正(zhèng)能量(liàng)

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可控靠近(jìn)

以AI绘画(huà)为代表的(de)AIGC上一次爆火的时候,还是(shì)2022年8月,在美国科罗拉多州举办的新兴(xīng)数字艺(yì)术家竞赛中,一幅名为《太空歌剧院(yuàn)》的作品获奖。

随后各(gè)大(dà)厂商的AI绘画(huà)软件被广(guǎng)大网友熟知(zhī)并体验,Stable Diffusion便是(shì)其(qí)中代表。

ChatGPT之后又一应用(yòng)杀(shā)疯了(le),AIGC或进入可(kě)控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量(liàng)

用户们可以(yǐ)在应用中输入一组关键词或者(zhě)一(yī)张照片,就能获(huò)得一(yī)幅AI创作的画作。

作画的关(guān)键就是所输入的文本。同一组关键词也可以创作出很多张风格不一(yī)样的画作,这让创作(zuò)的过程就像开(kāi)盲(máng)盒(hé)。

很(hěn)多用户很喜欢这(zhè)种不确定(dìng)的惊喜,他们(men)会将(jiāng)生成的(de)美图当做(zuò)头像。而另一部分喜欢翻看AI绘画的“翻车(chē)”作品。在社交媒体(tǐ)上,许多用户分享AI“翻车现场”,例如(rú),一(yī)位网友的(de)小狗照片(piàn)被(bèi)AI画成了“肌(jī)肉男(nán)”,还有网(wǎng)友的个人(rén)照(zhào)片被AI识别成了建筑。

而(ér)如(rú)今随着ControlNet的出现(xiàn)与加持,以往AI绘画的填写关键词游戏(xì)可能要被颠(diān)覆(fù)了(le)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料正(zhèng)能量

ControlNet是一(yī)位正(zhèng)在斯(sī)坦福读博的中国(guó)人张吕敏创作的一种(zhǒng)基于(yú)控制(zhì)点的图像变形(xíng)算法,主要用于(yú)数字图像处理(lǐ)、计算机视觉和计算机(jī)图形学等(děng)领域。

其(qí)SD插件一经发布,在短短(duǎn)的两(liǎng)天内便(biàn)成为了AI绘画领域最新的热点。

在(zài)此之前(qián),大家用(yòng)了很多(duō)方(fāng)法想让AI生(shēng)成的结(jié)果(guǒ)尽(jǐn)可能的符合要(yào)求,但是都不尽如人意,它的出现代(dài)表着AI生(shēng)成开始进入真正的可控时期。

因为ControlNet可以直接提取画(huà)面的构图,人(rén)物的(de)姿势和画(huà)面的深度信息(xī)等。有了它的帮助,就不(bù)用(yòng)频繁的用(yòng)提示词(cí)来碰(pèng)运气(qì),抽盲盒式(shì)的(de)创作了。

通(tōng)俗的(de)说ControlNet相当于给AI绘(huì)画加了“魔法”,不少博主的作(zuò)品已经获得了大量(liàng)的浏(liú)览量,“viggo”就(jiù)是其中之(zhī)一,他用朋友的照片直接带她们走进动漫世界(jiè)。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科技(jì)行(xíng)业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找到对(duì)应的关键(jiàn)词;最后用ControlNet插件绑定骨骼开始换关键词(cí)试效(xiào)果。

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能量

通过图片就可以看(kàn)出(chū)来,效果(guǒ)十分惊艳。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进(jìn)入可控期(qī),将洗(xǐ)牌科技行业?_黑料正能量

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入(rù)可控期,将洗牌科技行(xíng)业?_黑料正能量

更厉害的是,除(chú)了真实的照片(piàn),草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍到ControlNet还(hái)能(néng)实现线(xiàn)稿转全(quán)彩(cǎi)图。大(dà)神张吕敏其本尊也亲自(zì)回应。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业(yè)?_黑料正能量

不得(dé)不说当下AIGC已经变得越(yuè)来越强大,甚至输出(chū)的作品都已经能以假乱真了(le)。

02

难(nán)辨虚实,AIGC技(jì)术力爆发

警惕安全问题

近日,“苏州金鸡湖有(yǒu)游艇party”的消息火遍网(wǎng)络(luò),而经过警方(fāng)辟谣这所谓(wèi)的“party”可能是(shì)全(quán)国(guó)第一起AI绘图(tú)诈(zhà)骗。

由于这个活动里面给出的美女照(zhào)片(piàn)都是AI制作(zuò)的真(zhēn)人照(zhào)片绘图,因为太(tài)逼真,被大家当成真事传播(bō)了

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗牌科技行业?_黑(hēi)料正能量

不(bù)过仔细观察可以(yǐ)发(fā)现,活动发(fā)起(qǐ)者提供的(de)照片(piàn)中有个很(hěn)大(dà)的漏(lòu)洞可以(yǐ)发(fā)现并(bìng)非真(zhēn)人,而是AI绘图,那便(biàn)是(shì)图片中女性的手指(zhǐ)部分有的(de)存在异常。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料(liào)正(zhèng)能量

有行业人事表示(shì):“现在因为手指部分的绘画算法比(bǐ)较复杂,AI还不太会画人的(de)手,但最新看到的图片(piàn)已经有(yǒu)越(yuè)来越完美的(de)AI模型出现,以后可能(néng)就完全没有漏(lòu)洞了。

类似的(de)AI作图诈骗在国外也已有(yǒu)发(fā)生。据英国广播公司报道,土耳(ěr)其地震(zhèn)期(qī)间,有Tiktok用户(hù)使用(yòng)AI合成(chéng)了(le)儿童受灾的假照片(piàn)发(fā)布到网络(luò),以(yǐ)此诱骗(piàn)善良的人打赏(shǎng)“捐助(zhù)”从而实施诈骗。

目前随(suí)着技(jì)术(shù)发展,AIGC已经能做出真(zhēn)人照片般的绘图效果(guǒ),如果(guǒ)这样的图片被用来诈骗,将非常可(kě)怕。

此外AIGC还引发了很多担忧,一(yī)方面,批判者认为AI在“学习”了大量前人的作品之(zhī)后,其创作(zuò)没有任(rèn)何(hé)情绪和(hé)灵魂,难以和(hé)人(rén)类的艺术创作相提并(bìng)论。

另一(yī)方面,AIGC背后的版权、目前都并没有(yǒu)得到有效的解决,还有AIGC会不(bù)会代替人类“至(zhì)高无(wú)上”的创意(yì)。

马(mǎ)斯克也(yě)强调,人工智(zhì)能的(de)安全问题(tí)需要得到重(zhòng)视,太晚就来不及了。

03

AIGC下(xià)一站除(chú)了视频(pín),还有远(yuǎn)方

技术都(dōu)是(shì)有两面性的(de),潜在的危害并不能(néng)掩盖(gài)其光(guāng)辉(huī)的贡(gòng)献。现(xiàn)在看(kàn)来,人工智能技(jì)术将是第四(sì)次工(gōng)业革命的(de)核(hé)心驱动力量,将创造新的增长奇迹(jì)。

过去一年(nián),人工(gōng)智能在技术(shù)和商业层面(miàn)都有(yǒu)了巨(jù)大进展,AI绘画就是人工智能技术发生方向(xiàng)性改变的一(yī)个代表。其下一站或许就(jiù)是视(shì)频。

此(cǐ)前(qián),Meta和(hé)谷(gǔ)歌先后发布了几(jǐ)条引爆科技圈的短(duǎn)视频。这些视(shì)频(pín)引发关注并非内容做得多(duō)优秀,反而都非常简(jiǎn)单,比如一匹正在(zài)喝水的(de)马,一只画画(huà)的玩具熊,或(huò)者一(yī)段骑摩托(tuō)车的(de)第(dì)一视角(jiǎo)录像,随便一个有(yǒu)手机的(de)人都可以随手录下一段。观摩和观看的区别和联系,观摩和观看的区别在哪>

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能量

但这些短视(shì)频的创作方式非常(cháng)简单,创作者仅仅需要向AI输入(rù)一段话,甚至只是说一下(xià)要(yào)求,AI就可以根据(jù)需要生成一段视频。

谷歌发布的两个(gè)AI生(shēng)成视(shì)频分(fēn)别来自于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的(de)Make-A-Video没有太多(duō)的(de)差别。

在(zài)Make-A-Video公布了AI生成的视频(pín)后,AI圈就(jiù)已经(jīng)玩(wán)了一(yī)波梗,一个能够做(zuò)出更高清视(shì)频的AI还不足以在(zài)短时间内戳中兴奋点(diǎn)。

Phenaki更加令人震惊的地(dì)方在(zài)于,它(tā)可(kě)以(yǐ)制作出超过2分钟的连贯的也有(yǒu)确切(qiè)内(nèi)容的视(shì)频,这才(cái)是真正(zhèng)让(ràng)人们感到(dào)惊喜的地方。因为无论AI生(shēng)成的视频多么高清,也只能(néng)是为内容生产者提供(gōng)一(yī)个(gè)灵感,一(yī)个素材,一个(gè)过(guò)场动画。

不过能(néng)够制作出有具体剧情内(nèi)容的视频就(jiù)意味(wèi)着,一些视频创作(zuò)由(yóu)AI代(dài)替(tì)人工完(wán)成(chéng)已经初步(bù)有(yǒu)了(le)可能。

当(dāng)下AI的(de)发展速度已经超过大部分人的想象(xiàng)。内容产业的(de)本质是供给创造需求,AIGC作为(wèi)全新的(de)内容(róng)生产方式,可以为内容产业(yè)带来(lái)更(gèng)新的内容风格(gé)、更快的生产速度,更低的生产成本,这无疑会驱动内容产业的大爆发。

除了AI绘图、视(shì)频,AIGC技术还能(néng)应用于音乐、代码、机器(qì)人动作(zuò)等(děng)多(duō)种内容(róng)形式的(de)生成(chéng)。不难发现该项技术不仅在游戏等行业能得到有效(xiào)应用(yòng),对(duì)于下一代互联网各(gè)种元素的构(gòu)建亦(yì)有关键意义。

从商业化的角度来看,文化娱乐、教育、传(chuán)媒等诸多(duō)领域,本身就对基于AI的可视(shì)化内容有(yǒu)强烈(liè)需求。

因此,AI绘(huì)画及视频或不是结(jié)果,而只是AI进程中的一块重要(yào)拼图,有望在技术更新的加持下(xià)实现更大的(de)应用价值(zhí)。

AI从理(lǐ)解内容,走向了(le)可以生(shēng)成内容(róng),甚至能(néng)够创造出独立(lì)价值和独立视角的(de)内容。AIGC的再次出圈,更代表着(zhe)未来的先进(jìn)生(shēng)产(chǎn)力(lì)即将到来。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正(zhèng)能量

04

紧(jǐn)抓大模型与算力(lì),牢固(gù)AIGC底座

从技术(shù)的发展也可以看(kàn)出,在语(yǔ)言大(dà)模型、图像大模(mó)型之后,多模态大模(mó)型已经成为了新的趋势(shì)。

大模型被誉(yù)为当前人工(gōng)观摩和观看的区别和联系,观摩和观看的区别在哪智(zhì)能发展的智能底座,是全球竞(jìng)争(zhēng)最激烈的研究方向之一,包括谷歌、亚马逊、百度、阿里、腾讯(xùn)等众多头部企业(yè)都在竞相(xiāng)发(fā)力。

不过训练大模型的确价格不菲(fēi),以国(guó)盛证券发布(bù)的《ChatGPT需(xū)要多少算力》报(bào)告估(gū)算,GPT-3训练一次的成本约为140万美元。而对(duì)于一些更大的LLM(大型(xíng)语言(yán)模型),训练成本则介于200万美元至1200万(wàn)美元高价(jià)之(zhī)间。

以(yǐ)ChatGPT在2023年1月的独立访(fǎng)客平均数(shù)1300万(wàn)计算,其对应芯片(piàn)需(xū)求为3万多片(piàn)英伟达(dá)A100 GPU,初始投入成本约为8亿美元,每日仅电费就(jiù)在5万美元(yuán)左右。

ChatGPT之(zhī)后又(yòu)一应(yīng)用(yòng)杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科(kē)技行业?_黑料正能量

此外不论是(shì)ChatGPT还(hái)是AIGC,都离不开庞大算力支持。在关(guān)注各类大(dà)模型的发展(zhǎn)同时,更应(yīng)该关注算(suàn)力网络的建设。

算力(lì)网络正(zhèng)驱(qū)动AI产业发展(zhǎn)进入史诗级(jí)加速进程,让AIGC及(jí)通用(yòng)AI这(zhè)一(yī)人工(gōng)智(zhì)能发展的终极(jí)目标离得更近。

因为算力可以对突破性(xìng)技术创(chuàng)新提供大(dà)力的支持。这(zhè)方面,多模态大模型是典型。作为面(miàn)向(xiàng)未来强人工(gōng)智能(néng)、通用人工(gōng)智能的重要技术创新,多(duō)模态大模型(xíng)已经在人(rén)工智能(néng)领域提出了(le)很(hěn)多(duō)年,业界也(yě)有不少技术突破,但是(shì),多模态大模(mó)型进一步往下(xià)走,算力(lì)需求(qiú)呈(chéng)几何式上升,一般的算(suàn)力基础设施很快将难(nán)以胜(shèng)任。

从图像、文字、语(yǔ)音单独一项(xiàng)的训练(liàn),到(dào)双模(mó)态、三模态的跃迁,让人工(gōng)智(zhì)能可以灵活应对不同模态的转化、像人与世界交互一样自(zì)然(rán),这方面,由算力网(wǎng)络来驱动将(jiāng)有明显优势。

ChatGPT之后(hòu)又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

此外,还(hái)有很多(duō)需要(yào)爆发(fā)式增长的(de)算力来支撑的技术创(chuàng)新,将(jiāng)在(zài)人工智能算(suàn)力网络支(zhī)撑下快速推进。

AIGC已经露出曙光,期待在大模型和(hé)大算力的支(zhī)持(chí)下AIGC能持续颠覆内容生产的方式,将创造的边际(jì)成本降(jiàng)低(dī),让(ràng)万众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 观摩和观看的区别和联系,观摩和观看的区别在哪

评论

5+2=