橘子百科-橘子都知道橘子百科-橘子都知道

兰州大学电子邮箱地址,兰州大学邮箱入口

兰州大学电子邮箱地址,兰州大学邮箱入口 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人(rén)ChatGPT火爆以来(lái),微软公司创始人(rén)比尔·盖茨已多(duō)次公开谈(tán)论人工智能话题。在(zài)最近的一次采访中,他再次表示:“AI可(kě)能会让(ràng)科技(jì)行业迎来(lái)一次剧烈的(de)洗(xǐ)牌(pái)”。

这个结(jié)论是(shì)他(tā)在(zài)当地时(shí)间2月20日接受(shòu)《In Good Company》节目专访时提出(chū)的。

他预期,AI的发展(zhǎn)可能会威胁到谷歌(gē)的市占率,因为(wèi)微软(ruǎn)在AI方面的行动(dòng)相当迅(xùn)速(sù)。而最终科技巨头将把AI整合(hé)成用户的“全能助(zhù)手”,包揽(lǎn)一切(qiè)应用,与人们进行沟通(tōng)并提供(gōng)建议,可以取代亚马逊、Siri或Outlook等应用。

大(dà)佬口中全(quán)能助手(shǒu)的到来(lái)可能(néng)尚需(xū)时日,但由ControlNet引发的又一次AI绘画浪(làng)潮(cháo),让(ràng)AIGC在ChatGPT的话题热点包(bāo)围中杀出重(zhòng)围。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进入可<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>兰州大学电子邮箱地址,兰州大学邮箱入口</span></span>控(kòng)期,将(jiāng)洗牌科(kē)技行业?_黑料(liào)正能量

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可控靠近

以AI绘画为(wèi)代表(biǎo)的AIGC上一次爆火的时(shí)候,还(hái)是(shì)2022年(nián)8月,在美国(guó)科罗拉多州举办的新兴数字艺术(shù)家竞赛(sài)中,一幅名为《太空歌剧院》的作品获奖。

随(suí)后各大(dà)厂(chǎng)商(shāng)的AI绘画软件被广大网(wǎng)友熟知并体(tǐ)验,Stable Diffusion便是其中代表。

ChatGPT之后(hòu)又一应用(yòng)杀(shā)疯了,AIGC或(huò)进入可控期(qī),将洗牌科(kē)技行(xíng)业?_黑料正(zhèng)能量(liàng)

用户(hù)们可以在应用中输(shū)入(rù)一组关键词(cí)或(huò)者一张照片,就能获(huò)得(dé)一幅AI创(chuàng)作的画作。

作画的关键就是所(suǒ)输入的文本。同一组关键词也可以创(chuàng)作出很(hěn)多张风格(gé)不(bù)一样的画作,这让创(chuàng)作(zuò)的过程就像(xiàng)开(kāi)盲(máng)盒。

很多用户(hù)很喜欢这种不确定的惊喜,他们会将生成的美图当(dāng)做头像。而另一部分喜(xǐ)欢翻看AI绘(huì)画的“翻车”作品。在社交媒(méi)体上,许多用户(hù)分享AI“翻车现场”,例如,一位网友的小狗照(zhào)片被AI画(huà)成(chéng)了“肌(jī)肉(ròu)男”,还有网友的个人照(zhào)片被AI识别成了建筑(zhù)。

而如今(jīn)随着(zhe)ControlNet的出现与(yǔ)加持(chí),以(yǐ)往AI绘画的填写(xiě)关键词游戏可能要被颠覆了(le)。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入(rù)可控(kòng)期,将洗牌科技(jì)行业(yè)?_黑料(liào)正能量

ControlNet是一位正在斯坦福读(dú)博的(de)中国人张吕敏创作的(de)一种基于(yú)控(kòng)制点的图像(xiàng)变形算法,主要用于数(shù)字图像处(chù)理、计算机(jī)视觉和计(jì)算机图形(xíng)学等领域。

其SD插件一经发布,在短短的两天内(nèi)便成(chéng)为(wèi)了AI绘画领域最新的热点。

在(zài)此之前,大家用了很(hěn)多(duō)方(fāng)法想让AI生(shēng)成的结果尽可能的(de)符合(hé)要求,但是都不(bù)尽如人意,它的出现代表(biǎo)着AI生成(chéng)开始进入真正的可控时期。

因为ControlNet可以(yǐ)直接提取画面的构图,人物(wù)的姿势和画面(miàn)的深度信息等。有(yǒu)了(le)它的(de)帮助,就不用(yòng)频(pín)繁的用提示词(cí)来碰运气,抽盲盒式的创(chuàng)作了(le)。

通俗的说ControlNet相当于(yú)给(gěi)AI绘画加了“魔法(fǎ)”,不少博主的作品已经获得了(le)大量(liàng)的浏览量,“viggo”就是其中之一,他用朋友的照片直接带(dài)她(tā)们走进(jìn)动漫(màn)世界(jiè)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗(xǐ)牌科(kē)技行业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到(dào)对应的关键词;最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试效果。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑料正能量

通过图片就可以看(kàn)出来,效(xiào)果十分惊艳(yàn)。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科技行(xíng)业?_黑料正能量(liàng)

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业(yè)?_黑料(liào)正能量

更(gèng)厉害(hài)的是,除了真实(shí)的(de)照片,草(cǎo)图也可以加上“魔(mó)法”,知乎大牛“DevPoint”和(hé)“逗(dòu)砂”介绍到ControlNet还能实现线稿(gǎo)转全彩图。大神张吕(lǚ)敏其(qí)本尊也亲自回应。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或(huò)进入(rù)可控(kòng)期,将洗牌科(kē)技行业?_黑料正(zhèng)能量(liàng)

不得不说当(dāng)下AIGC已经变(biàn)得越来越强大(dà),甚至(zhì)输出的(de)作品都已经能以(yǐ)假(jiǎ)乱真了。

02

难辨虚实,AIGC技术(shù)力爆发

警惕安全问题

近(jìn)日(rì),“苏州金鸡湖(hú)有游艇(tǐng)party”的消息火遍网络,而经过警方辟谣这所谓的“party”可能是全(quán)国第一起(qǐ)AI绘(huì)图诈骗。

由于(yú)这(zhè)个(gè)活动(dòng)里面给出的(de)美女(nǚ)照片都(dōu)是(shì)AI制作(zuò)的真人照片绘图,因为太(tài)逼真(zhēn),被大家当成真事传播了

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料(liào)正能量

不过仔细观察可以发现,活(huó)动发起者(zhě)提(tí)供的照片中有个很大的漏洞可以发现并非真(zhēn)人,而是AI绘(huì)图,那便是图片(piàn)中女性的手指部分有的存(cún)在异常。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进(jìn)入(rù)可控期,将洗(xǐ)牌(pái)科技(jì)行(xíng)业?_黑料正能(néng)量

有行业人(rén)事(shì)表示:“现在因为(wèi)手指部(bù)分的绘画算(suàn)法比(bǐ)较复杂,AI还(hái)不太会画人的(de)手,但最新看(kàn)到的图片已经有越来(lái)越完美的(de)AI模型出(chū)现,以(yǐ)后可能就完全没有漏洞了。

类似(shì)的AI作图(tú)诈骗在国(guó)外也已有(yǒu)发生。据英国广播公司报道,土耳其(qí)地震期(qī)间,有Tiktok用户使用(yòng)AI合成了儿童受(shòu)灾的(de)假照片(piàn)发布(bù)到网络,以此诱(yòu)骗善良的人打赏“捐助”从而实施诈骗(piàn)。

目前随(suí)着(zhe)技术发(fā)展,AIGC已经能做出真人照(zhào)片(piàn)般的(de)绘(huì)图(tú)效果,如(rú)果这样的图(tú)片被(bèi)用来诈骗,将非常(cháng)可怕。

此(cǐ)外AIGC还引(yǐn)发了很多(duō)担忧,一(yī)方面,批判者认为AI在“学习”了大量前人的作品之后,其创作没有任(rèn)何情绪和灵(líng)魂,难以(yǐ)和人类的(de)艺术(shù)创作相提并论。

另一方面,AIGC背(bèi)后的版(bǎn)权(quán)、目前都并没有得到有效的解(jiě)决,还有AIGC会不会(huì)代替人类“至高无上”的创意。

马斯克也(yě)强调(diào),人工智能的安全(quán)问(wèn)题需要(yào)得到重(zhòng)视,太晚就来不及了(le)。

03

AIGC下一站除(chú)了视频,还(hái)有(yǒu)远方

技术都(dōu)是有两面性的,潜在的(de)危害并不(bù)能掩盖其光辉(huī)的(de)贡献。现在看(kàn)来,人工智能技(jì)术将是(shì)第四次工业革命的核心驱(qū)动力量,将创造(zào)新的增长奇(qí)迹。

过去一年,人工智能(néng)在技术和商(shāng)业层(céng)面都(dōu)有了巨大进展,AI绘画就是(shì)人(rén)工智能技术(shù)发(fā)生(shēng)方向性改变的(de)一个代(dài)表。其下一(yī)站(zhàn)或许就是视频。

此前(qián),Meta和谷歌先后发布了(le)几条(tiáo)引爆(bào)科技(jì)圈的短视(shì)频。这些视频引发关注并非内容做得多优秀,反而都非常简单,比如一匹正在(zài)喝水的马(mǎ),一只画(huà)画的(de)玩具(jù)熊,或者一段骑摩托车(chē)的(de)第一视角录像,随便(biàn)一(yī)个(gè)有手机的人都可以随(suí)手录下一段。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量(liàng)

但这些(xiē)短(duǎn)视频的(de)创作方式非(fēi)常(cháng)简单,创作者仅仅(jǐn)需(xū)要向AI输入一段话,甚(shèn)至只(zhǐ)是(shì)说(shuō)一下要(yào)求,AI就可以根据需要生成一(yī)段视(shì)频。

谷(gǔ)歌发布(bù)的两个AI生(shēng)成(chéng)视频分别来自(zì)于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没(méi)有太(tài)多的差别(bié)。

在Make-A-Video公(gōng)布了AI生成(chéng)的(de)视频后,AI圈就已(yǐ)经玩了一(yī)波梗(gěng),一个能够做出更高(gāo)清视(shì)频的AI还(hái)不(bù)足以在短(duǎn)时间内戳中兴奋点。

Phenaki更(gèng)加令人(rén)震惊(jīng)的(de)地方(fāng)在于,它可(kě)以制作(zuò)出超过2分钟(zhōng)的连(lián)贯的(de)也有确切内容的视频,这才(cái)是真正(zhèng)让人们感到惊喜的(de)地方(fāng)。因为无论(lùn)AI生成(chéng)的视频多(duō)么高清,也只能是为内容(róng)生产者提供一个灵感,一个(gè)素(sù)材,一个(gè)过场(chǎng)动画。

不过能够制(zhì)作出(chū)有(yǒu)具体剧情内容(róng)的(de)视频(pín)就意味着,一些视频创作由AI代替人工完成已经初步(bù)有了可能(néng)。

当下AI的发展速(sù)度已经超过(guò)大(dà)部分人的(de)想(xiǎng)象。内容产业的本质是供(gōng)给创造需求,AIGC作(zuò)为全新(xīn)的内容生产方式,可(kě)以为内容产业带(dài)来(lái)更(gèng)新的(de)内容(róng)风格、更快(kuài)的生产速(sù)度,更低的(de)生产成本,这无疑会驱动内(nèi)容产(chǎn)业(yè)的大爆发。兰州大学电子邮箱地址,兰州大学邮箱入口>

除了AI绘图(tú)、视频(pín),AIGC技术还能(néng)应用于音乐、代码(mǎ)、机器人(rén)动作等多种内容(róng)形式的生成。不难(nán)发现该(gāi)项技术不仅(jǐn)在游戏等行业能得到有(yǒu)效应用(yòng),对于下一代互联网各种元素(sù)的(de)构建亦有关键意(yì)义。

从商(shāng)业化的(de)角(jiǎo)度(dù)来看,文化娱乐、教育、传媒等诸多领域,本身就对基于AI的(de)可(kě)视化内容有强烈需求。

因此,AI绘画及视频或不是结果,而(ér)只是(shì)AI进程中的一块重要拼图,有望在技术更新的(de)加持下实现更大的应(yīng)用价值(zhí)。

AI从理解内容(róng),走向了可以生成(chéng)内容,甚至(zhì)能够创(chuàng)造出独立价(jià)值和独立视角的(de)内容。AIGC的再次出圈(quān),更(gèng)代(dài)表着(zhe)未(wèi)来(lái)的(de)先进生产力即将到来。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌科技行业?_黑料正能量

04

紧抓大模型与算(suàn)力,牢固(gù)AIGC底座

从技术的发(fā)展也可以看(kàn)出,在语言大(dà)模型、图像大模型之后(hòu),多模态(tài)大模(mó)型已经成为了(le)新的(de)趋势(shì)。

大模型被誉为当前(qián)人工智能发展的智能底座(zuò),是全球竞争最激(jī)烈的研究方向(xiàng)之(zhī)一,包括谷歌(gē)、亚(yà)马逊、百(bǎi)度、阿(ā)里、腾讯等众多(duō)头部企业都在竞相发力。

不过训练大模型的确价格(gé)不菲,以国(guó)盛证券发(fā)布的《ChatGPT需(xū)要多少算力(lì)》报告估(gū)算,GPT-3训练一次的(de)成本约为140万美元(yuán)。而对于一(yī)些更大(dà)的(de)LLM(大型(xíng)语言(yán)模型(xíng)),训(xùn)练成(chéng)本则(zé)介于200万美元至(zhì)1200万美元(yuán)高价之间。

以ChatGPT在(zài)2023年1月的独(dú)立访客平均数1300万计算,其对应芯片(piàn)需求为(wèi)3万多片英伟达A100 GPU,初始投入成(chéng)本约为8亿美元,每(měi)日仅电费就在5万美元左右(yòu)。

ChatGPT之后又(yòu)一(yī)应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技行(xíng)业?_黑(hēi)料正(zhèng)能量

此外不论(lùn)是ChatGPT还是AIGC,都离不开庞大算力支持。在关注(zhù)各类大模型(xíng)的(de)发(fā)展同时,更(gèng)应该关注算力网络的建设。

算力网络正驱动AI产业发展(zhǎn)进入史诗级加速进程,让AIGC及通用AI这一人工(gōng)智能发展的终极(jí)目(mù)标离得更近。

因为算力可以对突破性技术创新提供大力的支持。这方面,多模态大(dà)模型是典(diǎn)型。作(zuò)为(wèi)面向未来(lái)强人(rén)工(gōng)智能、通用(yòng)人(rén)工智能的重要技术(shù)创新,多模态大模型已经在人工(gōng)智能领域提出了(le)很多(duō)年,业(yè)界也(yě)有不少技术突破,但是,多模(mó)态大模型进(jìn)一(yī)步(bù)往下走,算力需求(qiú)呈几何(hé)式上升,一般的算力基础设施很快将难以胜任。

从图像、文字、语音单独(dú)一项(xiàng)的训练,到双(shuāng)模态、三模态的跃迁,让人(rén)工智能(néng)可以灵(líng)活应对不同(tóng)模态的转化、像人与世界交(jiāo)互一样(yàng)自然(rán),这方面(miàn),由(yóu)算(suàn)力(lì)网络来(lái)驱动将(jiāng)有明显(xiǎn)优势。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

此外,还(hái)有(yǒu)很多需要爆发式增(zēng)长的算力来支撑(chēng)的技(jì)术创(chuàng)新,将在(zài)人(rén)工智能(néng)算力网络支(zhī)撑下快速(sù)推(tuī)进。

AIGC已经露出曙光(guāng),期待在大模(mó)型和(hé)大算力(lì)的(de)支(zhī)持下AIGC能(néng)持续颠覆内容(róng)生产(chǎn)的方式(shì),将创造的边际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 兰州大学电子邮箱地址,兰州大学邮箱入口

评论

5+2=