橘子百科-橘子都知道橘子百科-橘子都知道

1分钟前刚刚哪里发生了地震

1分钟前刚刚哪里发生了地震 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机(jī)器人ChatGPT火(huǒ)爆(bào)以来,微(wēi)软公司创始人(rén)比尔·盖茨已多(duō)次公(gōng)开谈论人工(gōng)智能话题。在(zài)最近的(de)一次采(cǎi)访(fǎng)中,他再次(cì)表(biǎo)示(shì):“AI可能(néng)会让科技行业迎来(lái)一次剧烈(liè)的洗牌(pái)”。

这个结(jié)论(lùn)是他在当地(dì)时间2月20日接受《In Good Company》节目(mù)专访(fǎng)时(shí)提(tí)出的。

他(tā)预期,AI的发展可能会威胁到谷歌的市占率,因(yīn)为微软在AI方面的行动相当迅速。而最终科技巨头将把(bǎ)AI整合成用户的“全能(néng)助手”,包揽一(yī)切应用,与人们进行沟通并提供建议,可以取代亚马逊(xùn)、Siri或Outlook等应用(yòng)。

大佬口中(zhōng)全能助手(shǒu)的到来可能尚(shàng)需(xū)时日(rì),但(dàn)由ControlNet引(yǐn)发(fā)的又一次(cì)AI绘画浪(làng)潮,让AIGC在ChatGPT的(de)话(huà)题热(rè)点包围(wéi)中杀出重(zhòng)围。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控(kòng)靠近

以AI绘画(huà)为(wèi)代表的AIGC上一次爆火(huǒ)的(de)时候,还是(shì)2022年8月,在美国(guó)科罗拉多州举办的(de)新兴数字艺术家竞赛中,一(yī)幅名为《太空歌剧院》的作(zuò)品获(huò)奖。

随后各大厂(chǎng)商(shāng)的AI绘画软件被广(guǎng)大网友熟知(zhī)并体验(yàn),Stable Diffusion便(biàn)是其中代表。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控期(qī),将洗牌科技行(xíng)业?_黑料正(zhèng)能量(liàng)

用户们可(kě)以在应用中输(shū)入一组关键词或者一张(zhāng)照片,就能获得一(yī)幅AI创作的画作。

作画的关(guān)键就是所输入的(de)文本。同一组关键词(cí)也可以创(chuàng)作出很(hěn)多(duō)张风格不一样的(de)画(huà)作(zuò),这让创(chuàng)作的过程(chéng)就像开(kāi)盲盒。

很多用户很喜欢(huān)这(zhè)种不(bù)确定的惊喜,他们会将生成的(de)美图当做(zuò)头像。而另(lìng)一部分(fēn)喜(xǐ)欢翻看(kàn)AI绘画(huà)的“翻车”作品。在社交媒(méi)体(tǐ)上,许多用户分享AI“翻车现场”,例如(rú),一位(wèi)网(wǎng)友的小(xiǎo)狗照(zhào)片被AI画成了(le)“肌肉(ròu)男”,还(hái)有网友的个人照片(piàn)被(bèi)AI识别成了建筑。

而如(rú)今随着ControlNet的(de)出现与加持,以往AI绘(huì)画的填写关键词游戏(xì)可能要被颠覆了。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或(huò)进(jìn)入可控期,将洗牌科(kē)技行业?_黑料正能量

ControlNet是一位正在(zài)斯(sī)坦福读(dú)博的中(zhōng)国人张吕敏创(chuàng)作的一种基于控(kòng)制(zhì)点的图像变形(xíng)算法,主(zhǔ)要用于(yú)数字图像处理(lǐ)、计(jì)算(suàn)机视(shì)觉(jué)和计算机图形学(xué)等领域。

其(qí)SD插件(jiàn)一经(jīng)发布,在短短(duǎn)的两天内便(biàn)成为了(le)AI绘画领(lǐng)域最新的热点。

在此之(zhī)前(qián),大家(jiā)用了很多方法想让AI生成的结(jié)果(guǒ)尽可能(néng)的(de)符合要求(qiú),但是都不尽如人意,它的出现(xiàn)代表着AI生成开始进入真正的可控时期。

因为ControlNet可以直接提取画面(miàn)的(de)构(gòu)图,人物(wù)的(de)姿势和画面的深度信(xìn)息等。有了(le)它的帮(bāng)助,就不用频繁的用提示词来碰运气,抽盲盒式的创作(zuò)了(le)。

通俗的(de)说ControlNet相当(dāng)于给AI绘(huì)画加了(le)“魔法(fǎ)”,不(bù)少博主的(de)作品已经获得(dé)了大量的浏览(lǎn)量,“viggo”就是其中之一(yī),他用朋友(yǒu)的照片直接带她们走进(jìn)动(dòng)漫世界。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进入可(kě)控(kòng)期(qī),将洗牌科技行(xíng)业(yè)?_黑料正能量

viggo先用StableDiffusion图片转文字。

再(zài)用Text2Prompt插件拓展找(zhǎo)到对应(yīng)的(de)关键词;最后(hòu)用ControlNet插(chā)件绑定骨骼开始换(huàn)关键词试(shì)效果。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行业(yè)?_黑料正(zhèng)能量

通(tōng)过图(tú)片就可以(yǐ)看出(chū)来,效果十分惊艳。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进(jìn)入可控期(qī),将(jiāng)洗牌(pái)科技行业?_黑料正能量(liàng)

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业?_黑料正能(néng)量

更厉1分钟前刚刚哪里发生了地震害的(de)是(shì),除了真实的(de)照片,草图也可以(yǐ)加上“魔法”,知乎大(dà)牛“DevPoint”和“逗砂(shā)”介(jiè)绍到ControlNet还(hái)能(néng)实现线稿转全彩(cǎi)图。大神张吕敏其(qí)本尊也(yě)亲自回应。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可(kě)控期,将洗(xǐ)牌(pái)科技(jì)行业?_黑料正能量

不得不说当下AIGC已经(jīng)变得越来越(yuè)强大,甚至输出(chū)的(de)作品都已经能以假乱(luàn)真了。

02

难(nán)辨虚实,AIGC技术(shù)力爆发

警惕(tì)安(ān)全问(wèn)题

近日(rì),“苏州金鸡(jī)湖有游(yóu)艇(tǐng)party”的消息火遍网络(luò),而经过(guò)警(jǐng)方辟(pì)谣(yáo)这所(suǒ)谓(wèi)的“party”可能是全国第一起AI绘图诈(zhà)骗。

由于这(zhè)个(gè)活动里面给出(chū)的(de)美女照(zhào)片都是AI制作(zuò)的(de)真人照(zhào)片绘(huì)图,因为太逼(bī)真,被大(dà)家当成真(zhēn)事传(chuán)播(bō)了(le)

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科技(jì)行业(yè)?_黑料正能量

不过(guò)仔细观察可以发现,活动发(fā)起者提供的照片(piàn)中有个很大的漏洞可(kě)以发现并(bìng)非真人,而是AI绘图,那(nà)便(biàn)是(shì)图片中(zhōng)女性的手指部分有的存(cún)在异(yì)常。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗(xǐ)牌科技行业(yè)?_黑(hēi)料正能量

有行业人(rén)事表示:“现在因为手指部(bù)分的绘画算法(fǎ)比(bǐ)较复(fù)杂,AI还不太会画人的(de)手,但最新看到的图片(piàn)已经有越来越完美的AI模型出现,以后可能就完(wán)全没有漏洞了。

类似(shì)的AI作图诈骗在国外也已(yǐ)有发生。据英国广(guǎng)播公(gōng)司报(bào)道,土耳其(qí)地(dì)震期(qī)间,有(yǒu)Tiktok用户(hù)使用AI合成了儿童受(shòu)灾的假照片(piàn)发(fā)布(bù)到网络(luò),以此(cǐ)诱骗善良的人打赏“捐助”从而实施(shī)诈骗(piàn)。

目前随着技术(shù)发展,AIGC已经(jīng)能做出真人照(zhào)片(piàn)般(bān)的绘图效果,如果(guǒ)这(zhè)样的图片被用来诈骗,将非常(cháng)可怕。

此外AIGC还引发了(le)很(hěn)多担忧,一方面,批(pī)判者认为AI在“学习”了大量前(qián)人的作品(pǐn)之后(hòu),其创作没有任何情绪和(hé)灵魂,难以(yǐ)和人类的艺术(shù)创作相提并论。

另一方面,AIGC背后的版权、目前都并没有得到(dào)有效的解决,还有AIGC会不会(huì)代替(tì)人类“至(zhì)高(gāo)无(wú)上”的创(chuàng)意。

马斯克(kè)也强(qiáng)调,人(rén)工智(zhì)能的(de)安全问题需(xū)要得到重视,太晚就来(lái)不及了。

03

AIGC下一站(zhàn)除了视(shì)频,还(hái)有远(yuǎn)方

技术都是有两(liǎng)面性的,潜在的(de)危害并不能(néng)掩盖其光辉的贡献。现在(zài)看来,人工智能技术将是(shì)第(dì)四次工业革(gé)命的核心(xīn)驱(qū)动力量,将创造新(xīn)的(de)增长奇迹。

过(guò)去(qù)一(yī)年,人(rén)工智(zhì)能在技术和(hé)商业(yè)层面都有了巨大进展,AI绘画就是人工智能(néng)技术发生(shēng)方向性(xìng)改变的一个代表。其下(xià)一站(zhàn)或许就(jiù)是(shì)视频。

此前,Meta和谷(gǔ)歌先(xiān)后(hòu)发(fā)布(bù)了几条(tiáo)引爆科技圈的短视频。这(zhè)些视(shì)频引发关注(zhù)并非(fēi)内容(róng)做得多优秀,反而都非常简单,比(bǐ)如一匹正在喝水的马,一只画画(huà)的玩具(jù)熊,或者一段骑摩托车的第一视角录像,随便一个有手机的人都可以随手录下一段。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或(huò)进入(rù)可控期(qī),将洗牌科技行(xíng)业?_黑料正能量

但这些短视(shì)频(pín)的创(chuàng)作方式非(fēi)常简(jiǎn)单,创作者仅仅需要向AI输入一段(duàn)话,甚(shèn)至只是说一下要求,AI就可以根(gēn)据需要生成一段视(shì)频。

谷歌发布(bù)的(de)两个AI生成(chéng)视频分(fēn)别来自于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有(yǒu)太多(duō)的差别。

在Make-A-Video公布了AI生成的视频后,AI圈就已经玩了(le)一(yī)波梗,一个(gè)能够(gòu)做出(chū)更高(gāo)清视频的AI还(hái)不足(zú)以(yǐ)在短时间内戳(chuō)中兴奋(fèn)点(diǎn)。

Phenaki更加令人震惊(jīng)的(de)地方在于(yú),它可(kě)以(yǐ)制作出超过2分钟的连贯的也有确切内容的视频,这才是真正(zhèng)让人(rén)们感到惊喜(xǐ)的地方。因为无论AI生成的视频多么高清,也只能是为内容生产(chǎn)者提供(gōng)一个(gè)灵感(gǎn),一个素材,一个过场动画。

不(bù)过能够(gòu)制作出有(yǒu)具体剧情内容的视频(pín)就意味(wèi)着,一些视(shì)频创(chuàng)作由AI代替(tì)人工完成(chéng)已经初步有了可能(néng)。

当下AI的发(fā)展(zhǎn)速(sù)度(dù)已(yǐ)经超过大部(bù)分人的(de)想象。内容产业的本(běn)质是供给创造需求(qiú),AIGC作为全新的内容生产(chǎn)方(fāng)式,可以为(wèi)内(nèi)容产业带来更新的内容(róng)风格、更快的(de)生产速度,更(gèng)低的生产成本,这无疑会驱(qū)动内(nèi)容产业的大爆(bào)发(fā)。

除(chú)了AI绘(huì)图、视频(pín),AIGC技术(shù)还(hái)能应用(yòng)于(yú)音乐、代(dài)码(mǎ)、机器人动作等多种内容形式的生成(chéng)。不(bù)难发现该项技(jì)术不(bù)仅(jǐn)在游戏等行业能得(dé)到有效应用,对于下一代互联网各种元素(sù)的构建亦有(yǒu)关键意义。

从(cóng)商业(yè)化的角度来看,文化(huà)娱乐(lè)、教育、传媒等(děng)诸多领域(yù),本身(shēn)就对(duì)基于(yú)AI的可视(shì)化内容有(yǒu)强烈需求(qiú)。

因此,AI绘画及视频(pín)或不是结果,而只是AI进程中的一块(kuài)重要拼图,有望(wàng)在技术(shù)更(gèng)新的加持下实现更大的(de)应(yīng)用价值(zhí)。

AI从(cóng)理解内容(róng),走向了可以生成内容,甚(shèn)至(zhì)能(néng)够创造出独立价(jià)值和独立视角的(de)内容。AIGC的再次出圈(quān),更代表着(zhe)未来的先进生(shēng)产力(lì)即(jí)将(jiāng)到来。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科(kē)技行(xíng)业?_黑料正能量(liàng)

04

紧(jǐn)抓大模(mó)型与算力,牢固AIGC底座(zuò)

从技(jì)术的(de)发展也可以看出,在语(yǔ)言(yán)大模(mó)型、图像大模型之(zhī)后,多(duō)模态大(dà)模型已(yǐ)经成为了新的趋势。

大模型被誉(yù)为(wèi)当前人工智能(néng)发展的智能底座,是全球竞(jìng)争(zhēng)最激烈的研究方向之一,包(bāo)括谷歌、亚(yà)马逊、百度、阿(ā)里、腾讯等众(zhòng)多(duō)头部企业(yè)都(dōu)在(zài)竞相(xiāng)发力。

不过训练大(dà)模型的(de)确价(jià)格不菲,以国盛(shèng)证券发布的《ChatGPT需要(yào)多少算(suàn)力(lì)》报告(gào)估算,GPT-3训练(liàn)一次(cì)的成(chéng)本约为140万美元(yuán)。而(ér)对于(yú)一些更大的LLM(大型语言模型),训练成本则介于200万美元至1200万美元高价之(zhī)间(jiān)。

以ChatGPT在2023年(nián)1月的独立访客平均数1300万计算,其(qí)对应芯片需求为3万多(duō)片英(yīng)伟达A100 GPU,初始投入成本约为(wèi)8亿(yì)美元(yuán),每日仅(jǐn)电费就在5万美元左右。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

此(cǐ)外不论是(shì)ChatGPT还是AIGC,都离不开庞大(dà)算(suàn)力(lì)支持。在(zài)关注各(gè)类大模(mó)型的发展同时,更(gèng)应(yīng)该(gāi)关注算力网络的(de)建设。

算(suàn)力(lì)网络正(zhèng)驱动AI产业发展进(jìn)入史诗级加速进程,让AIGC及通用AI这一人工智能(néng)发展(zhǎn)的(de)终极目标离得(dé)更近。

因(yīn)为(wèi)算力可以对突破性(xìng)技术创新提供大力的(de)支持。这方面,多模态大(dà)模型是(shì)典(diǎn)型。作为面(miàn)向(xiàng)未来(lái)强人工智能、通用人工(gōng)智能的重(zhòng)要技术(shù)创新,多模态大模型已经在人工智能领域提出了很多(duō)年,业界也有不少技术突(tū)破,但是,多模态大模型进一(yī)步往下走,算(suàn)力需求呈(chéng)几何式上升,一(yī)般的算力基础设施很快将难以胜(shèng)任。

从(cóng)图(tú)像、文(wén)字(zì)、语音单独一项的训练(liàn),到双(shuāng)模态(tài)、三模态(tài)的跃迁(qiān),让(ràng)人工(gōng)智能可以灵活(huó)应对不同模态的转(zhuǎn)化(huà)、像人与(yǔ)世(shì)界交互一样自然,这方面,由算力网(wǎng)络来驱动将有明(míng)显优势。

ChatGPT之后又一应(yīng)用(yòng)杀疯(fēng)了,AIGC或进入(rù)可控期,将洗牌科技行(xíng)业(yè)?_黑料正能(néng)量

此外,还有很多需要爆(bào)发式(shì)增长的算(suàn)力来支撑(chēng)的(de)技术创新,将在人工智能算力网络(luò)支(zhī)撑下快速推进。

AIGC已经(jīng)露出曙光,期待在大模型和大算(suàn)力的支持下AIGC能持续颠覆内容生产的方式,将(jiāng)创造的边(biān)际成本降低(dī),让(ràng)万众受益。

未经允许不得转载:橘子百科-橘子都知道 1分钟前刚刚哪里发生了地震

评论

5+2=