橘子百科-橘子都知道橘子百科-橘子都知道

发奋还是发愤读书啊,发奋还是发愤图强

发奋还是发愤读书啊,发奋还是发愤图强 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊(liáo)天机器(qì)人ChatGPT火(huǒ)爆(bào)以来,微软公司创始人比尔·盖茨已多(duō)次公开(kāi)谈论人工智能话题(tí)。在最近的一次采访中,他再次表示:“AI可能(néng)会让科技行业迎来一次剧烈的洗牌”。

这个(gè)结(jié)论是(shì)他在当地时间2月20日接受《In Good Company》节目专(zhuān)访时提出(chū)的。

他预期,AI的发展可(kě)能会威胁(xié)到谷歌的市占率,因(yīn)为微软在AI方面的行动(dòng)相当迅(xùn)速。而最终科(kē)技(jì)巨(jù)头将把(bǎ)AI整合成用户的“全能助手”,包(bāo)揽一(yī)切应用,与人们进行沟(gōu)通并提供建(jiàn)议,可(kě)以取代亚(yà)马逊、Siri或Outlook等应用。

大佬口中全能(néng)助手的到来可能尚(shàng)需时(shí)日(rì),但由ControlNet引发(fā)的又一次AI绘画(huà)浪(làng)潮,让AIGC在ChatGPT的话题热点包围中(zhōng)杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期(qī),将洗牌科技(jì)行(xíng)业?_黑(hēi)料正(zhèng)能量

01

ControlNet颠(diān)覆AI绘(huì)画新玩法

AIGC向可控靠近

以AI绘画(huà)为代表的AIGC上一次(cì)爆火的时候,还(hái)是2022年8月,在美国科罗拉多州举办的新兴数字(zì)艺术家竞(jìng)赛中,一幅名为《太空歌剧(jù)院》的作品获奖。

随后(hòu)各大厂商的AI绘画软件被广(guǎng)大网友熟(shú)知并(bìng)体验,Stable Diffusion便(biàn)是其中(zhōng)代表。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业?_黑(hēi)料(liào)正能(néng)量

用户们可(kě)以在应用中输入一组关(guān)键词或者一张照片,就能(néng)获得一幅(fú)AI创作的画作。

作画的(de)关键就是所输入(rù)的文本。同一组关键(jiàn)词也可以创作出(chū)很多张(zhāng)风格不一样的画作,这让创作的(de)过程(chéng)就像开(kāi)盲(máng)盒(hé)。

很多用户很喜欢这种不确定(dìng)的惊喜,他们会将生成的美图当做头像。而另一部(bù)分喜欢(huān)翻(fān)看AI绘画(huà)的“翻车”作品。在社交媒体上(shàng),许多用(yòng)户(hù)分享AI“翻车现场”,例如,一位网友(yǒu)的小狗照片被AI画发奋还是发愤读书啊,发奋还是发愤图强成了(le)“肌肉(ròu)男”,还有网友的个(gè)人照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加持,以往AI绘(huì)画的填写关键词游(yóu)戏可能(néng)要(yào)被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科(kē)技行(xíng)业?_黑料正能量

ControlNet是一位正在斯坦(tǎn)福读博(bó)的中(zhōng)国人张吕敏创作(zuò)的(de)一种基于控制点的图像(xiàng)变形算法,主要(yào)用于(yú)数字图像处理、计算机(jī)视觉和计算机图形(xíng)学(xué)等领域。

其(qí)SD插件一经发布,在(zài)短(duǎn)短的两天(tiān)内便成(chéng)为了AI绘(huì)画领(lǐng)域最新的热点。

在(zài)此之(zhī)前,大(dà)家用了(le)很多(duō)方法想让AI生成的(de)结果(guǒ)尽可(kě)能的符合(hé)要求,但是都(dōu)不尽(jǐn)如(rú)人意,它的出现代表着AI生成(chéng)开(kāi)始进(jìn)入真(zhēn)正的(de)可控时期。

因为ControlNet可以直接提(tí)取画面(miàn)的构(gòu)图,人物的姿(zī)势和画面的深度信息等。有了它(tā)的帮助,就(jiù)不(bù)用频繁的(de)用提示(shì)词来碰运气,抽盲盒式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了“魔(mó)法”,不少(shǎo)博主(zhǔ)的作品(pǐn)已(yǐ)经获(huò)得了大量的浏览量,“viggo”就是其中之(zhī)一,他用朋友的照片直接(jiē)带她们走进动漫世界。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

viggo先用(yòng)StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应的关(guān)键词;最后(hòu)用ControlNet插(chā)件绑定骨骼开始换关(guān)键词试效果。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌(pái)科(kē)技行业(yè)?_黑(hēi)料正能量

通过图片就可以看出(chū)来,效果十分惊艳。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入(rù)可控(kòng)期,将洗(xǐ)牌(pái)科(kē)技行业?_黑料正能量

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料正能量(liàng)

更厉害(hài)的是,除(chú)了真实的照片,草图也可以加上“魔(mó)法(fǎ)”,知(zhī)乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线稿转全彩图。大神(shén)张吕敏其本(běn)尊也亲(qīn)自回应。

ChatGPT之后又一(yī)应用(yòng)杀疯(fēng)了,AIGC或进(jìn)入可(kě)控期,将(jiāng)洗牌(pái)科技行业?_黑料正能量

不得不(bù)说当下AIGC已经变得(dé)越(yuè)来越(yuè)强大(dà),甚至(zhì)输出的作品(pǐn)都已经能以假乱(luàn)真了。

02

难辨虚实(shí),AIGC技(jì)术力爆发(fā)

警惕安全问题

近日,“苏州金鸡湖有游艇party”的(de)消息火(huǒ)遍(biàn)网(wǎng)络,而经过警(jǐng)方辟谣这所谓的(de)“party”可能是全(quán)国第一(yī)起AI绘(huì)图诈骗。

由于这个活(huó)动里面给出的(de)美(měi)女(nǚ)照片都是AI制(zhì)作(zuò)的真人照(zhào)片绘图,因为太逼真,被大(dà)家当(dāng)成真事(shì)传播了

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技行业(yè)?_黑料正能量

不过仔(zǎi)细观察(chá)可(kě)以发(fā)现,活动发起者提供的照片中有个很大的(de)漏洞可以发现并非真人,而是AI绘图,那(nà)便(biàn)是图片中女性的手(shǒu)指(zhǐ)部分有的存在异常。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技(jì)行业?_黑料正能量

有(yǒu)行业(yè)人事(shì)表示:“现在因(yīn)为手指部分的(de)绘画算法(fǎ)比(bǐ)较复(fù)杂,AI还不太会(huì)画人的(de)手,但最新看到(dào)的图片(piàn)已经有越来越完(wán)美的AI模(mó)型出现,以(yǐ)后(hòu)可能(néng)就完全没有(yǒu)漏洞了。

类似的AI作图诈骗在国外也已有发生。据英(yīng)国(guó)广播公司(sī)报道,土(tǔ)耳其地震期间,有Tiktok用户使用AI合成(chéng)了儿童受灾(zāi)的(de)假照片发布到(dào)网络,以此诱骗善良(liáng)的人打(dǎ)赏“捐(juān)助”从而实施诈骗。

目(mù)前随着技(jì)术发展,AIGC已经能做出(chū)真人照(zhào)片般的绘图效果,如果这样(yàng)的图片被用来诈骗(piàn),将非常可怕。

此外(wài)AIGC还引发了(le)很多担忧(yōu),一方(fāng)面,批判者认为AI在“学习”了大量前(qián)人的作品之后,其创作没有任何情绪和灵魂,难以和(hé)人类(lèi)的艺术创作相提并论。

另一(yī)方面,AIGC背后(hòu)的版权、目前都并没有得(dé)到(dào)有效的解决,还有AIGC会不会代(dài)替人(rén)类“至高无上”的创意。

马斯(sī)克也强(qiáng)调,人(rén)工(gōng)智能的安(ān)全问题需要得(dé)到重视(shì),太晚就(jiù)来不(bù)及了。

03

AIGC下一站除了视频(pín),还有远方

技术都是(shì)有(yǒu)两面性的,潜在的(de)危害并不能掩盖其光辉的贡献。现(xiàn)在(zài)看来,人工(gōng)智能技术(shù)将是第四次工业(yè)革(gé)命的核心驱(qū)动力量,将创造新的增长奇迹。

过去一年(nián),人(rén)工智能(néng)在技术和商业层面都有了巨大进(jìn)展,AI绘画就是人(rén)工智能技术发生方向性改变的一个代表。其下一站或(huò)许(xǔ)就是视频。

此前,Meta和谷(gǔ)歌先后发(fā)布(bù)了几条引爆科技圈的短(duǎn)视频(pín)。这些视频引发关注并非(fēi)内容做得多优秀,反而都非(fēi)常简单(dān),比如(rú)一匹正在(zài)喝(hē)水的马,一只画(huà)画的玩具熊,或者一(yī)段骑(qí)摩托车的第(dì)一(yī)视角录(lù)像,随(suí)便一(yī)个有手机的人都(dōu)可以随手录下(xià)一段(duàn)。

ChatGPT之后又(yòu)一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正能(néng)量

但这些短视频的(de)创作(zuò)方式非常简单,创(chuàng)作者仅(jǐn)仅需要向AI输入一段(duàn)话(huà),甚(shèn)至只是说(shuō)一下要(yào)求,AI就可以根(gēn)据(jù)需(xū)要(yào)生成一(yī)段视频。

谷歌发布的两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是(shì)高清(qīng),与Meta的Make-A-Video没有太(tài)多的差别(bié)。

在Make-A-Video公布了AI生成的视频后(hòu),AI圈就已经玩(wán)了一波梗,一(yī)个能够做出更高(gāo)清视频的AI还不(bù)足以在短时间(jiān)内(nèi)戳中兴奋(fèn)点。

Phenaki更加令人震惊(jīng)的地方(fāng)在于,它可以制作(zuò)出超过2分钟(zhōng)的连贯的(de)也有确切内容的视频,这才是真正让人们感到惊喜的(de)地方。因(yīn)为(wèi)无论AI生(shēng)成(chéng)的视频多么高清(qīng),也只能(néng)是为内容(róng)生产者(zhě)提供一个灵感,一个素材,一个过场动画。

不(bù)过能够制(zhì)作出有具体剧情内(nèi)容的视频就意味着,一些视频创作由AI代替人工(gōng)完成已经初步有了可能。

当下AI的发展速度已(yǐ)经(jīng)超过大(dà)部分人的(de)想象。内容产(chǎn)业(yè)的本质(zhì)是供给创造需求(qiú),AIGC作为全新的(de)内容生产方式,可(kě)以(yǐ)为内容产业带来更新的(de)内容风格、更快(kuài)的生产速度(dù),更(gèng)低的生产成(chéng)本,这无(wú)疑(yí)会驱动内容(róng)产业的大爆发。

除了(le)AI绘图、视(shì)频,AIGC技术(shù)还能应用(yòng)于音乐(lè)、代码、机器人(rén)动作等多种内容形式的生成。不难发(fā)现该(gāi)项技术不仅(jǐn)在游戏等(děng)行业能得到(dào)有(yǒu)效(xiào)应(yīng)用,对于下(xià)一代互联网各种元素的(de)构(gòu)建亦有关键(jiàn)意(yì)义。

从商业化的角(jiǎo)度(dù)来看,文化娱(yú)乐、教育、传媒等诸多领(lǐng)域,本身就对基于AI的可视(shì)化内容有强烈需求。

因此,AI绘画及视(shì)频或不是结果,而只是AI进(jìn)程中的一块重要拼图,有望(wàng)在技术(shù)更新的(de)加持下实现更大的应用价值。

AI从理解(jiě)内容,走(zǒu)向了可以生成内容(róng),甚至能(néng)够创(chuàng)造出独(dú)立价值和独(dú)立视角的内容。AIGC的(de)再次出圈,更(gèng)代(dài)表(biǎo)着未来的先进生产力(lì)即将到来。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或(huò)进入可控期(qī),将洗牌科技行业?_黑(hēi)料(liào)正能量(liàng)

04

紧抓大模型(xíng)与算(suàn)力,牢固AIGC底(dǐ)座

从(cóng)技术(shù)的发展也(yě)可(kě)以看出,在(zài)语言(yán)大模型、图(tú)像大模型之后,多(duō)模态(tài)大(dà)模(mó)型已经成(chéng)为了新(xīn)的趋势(shì)。

大(dà)模型被(bèi)誉为当前人工智能(néng)发展(zhǎn)的智(zhì)能底座,是全球竞争最激烈(liè)的研(yán)究方向(xiàng)之一,包括谷歌、亚马逊、百度、阿(ā)里、腾讯(xùn)等众多头部企业都在(zài)竞相发(fā)力。

不过训(xùn)练(liàn)大模型的确价格不菲,以国盛证(zhèng)券(quàn)发布的(de)《ChatGPT需要多少(shǎo)算力》报告(gào)估算,GPT-3训练一次的成本约为(wèi)140万(wàn)美(měi)元。而对于(yú)一些更大的LLM(大(dà)型语言模(mó)型(xíng)),训(xùn)练(liàn)成本则介(jiè)于200万美元至1200万美(měi)元高价之(zhī)间。

以(yǐ)ChatGPT在2023年(nián)1月的独立访(fǎng)客(kè)平均(jūn)数(shù)1300万计(jì)算,其对应(yīng)芯(xīn)片需求(qiú)为3万(wàn)多(duō)片(piàn)英伟(wěi)达A100 GPU,初始投入成(chéng)本约为(wèi)8亿(yì)美元(yuán),每日仅电费就在5万美元左右。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业(yè)?_黑料正(zhèng)能量

此外不论(lùn)是ChatGPT还是AIGC,都离不(bù)开庞大算力支持。在关注各(gè)类大模型的发展同时(shí),更(gèng)应该关注(zhù)算力(lì)网络的建设。

算力网络正驱动(dòng)AI产业发(fā)展进(jìn)入史诗(shī)级加速进程(chéng),让(ràng)AIGC及通用AI这(zhè)一人(rén)工智能(néng)发展的终极(jí)目标离(lí)得更(gèng)近。

因为算力可(kě)以对突破性(xìng)技(jì)术创(chuàng)新提(tí)供(gōng)大力的支持。这方面,多(duō)模态大模型(xíng)是典型。作为面(miàn)向(xiàng)未来强人工智能、通(tōng)用人工(gōng)智能的重要技术创新,多模态大模型(xíng)已经(jīng)在人工(gōng)智能(néng)领(lǐng)域(yù)提出了很多年,业界也有不(bù)少技术突破,但是,多(duō)模态大模型进一步往下(xià)走(zǒu),算力需(xū)求(qiú)呈几何式(shì)上升(shēng),一(yī)般(bān)的算力基础设施很快将难以(yǐ)胜任。

从图(tú)像、文字、语音单(dān)独一项的训练,到双(shuāng)模态、三模态的(de)跃迁,让人工(gōng)智能(néng)可(kě)以灵活应对不(bù)同(tóng)模态的转(zhuǎn)化、像人(rén)与世界交(jiāo)互一样自然,这方面,由算(suàn)力网络来驱动将有明(míng)显优(yōu)势。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正能量

此外,还有(yǒu)很(hěn)多需要爆(bào)发式增(zēng)长(zhǎng)的算力来支撑的技术(shù)创(chuàng)新,将(jiāng)在(zài)人工(gōng)智能算力网(wǎng)络支撑下快(kuài)速(sù)推进(jìn)。

AIGC已经露出曙光,期待在大模型(xíng)和大(dà)算力的(de)支(zhī)持下AIGC能(néng)持续颠覆内容生产的方(fāng)式,将创(chuàng)造的边(biān)际成本降低,让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 发奋还是发愤读书啊,发奋还是发愤图强

评论

5+2=