橘子百科-橘子都知道橘子百科-橘子都知道

两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃

两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器(qì)人ChatGPT火爆以来,微软公司创始人(rén)比(bǐ)尔·盖茨(cí)已多次公开谈论(lùn)人工智能话题。在最(zuì)近的一(yī)次采访(fǎng)中(zhōng),他再(zài)次表示:“AI可能会让科技行业(yè)迎来一(yī)次剧烈的洗牌”。

这个结论是他在当地时(shí)间2月(yuè)20日接受《In Good Company》节目专访(fǎng)时提出的。

他预期,AI的发展可能会(huì)威胁到谷歌的市占率,因为微软在AI方面的(de)行动相(xiāng)当迅速。而最终科(kē)技(jì)巨头将把AI整合(hé)成用户的(de)“全能助(zhù)手”,包揽(lǎn)一切应用,与(yǔ)人们进(jìn)行(xíng)沟通并提供建议,可以取代亚(yà)马逊、Siri或Outlook等应用。

大(dà)佬口(kǒu)中全能助(zhù)手的到来可能尚(shàng)需(xū)时日,但由(yóu)ControlNet引发的又一次AI绘(huì)画浪潮,让(ràng)AIGC在ChatGPT的话题热点包围中杀出重(zhòng)围。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量(liàng)

01

ControlNet颠覆AI绘(huì)画新玩法

AIGC向可控靠近

以AI绘画为代(dài)表的AIGC上一次爆火的(de)时候,还是(shì)2022年8月,在(zài)美国科罗拉多(duō)州举办的新兴数字(zì)艺术家竞赛中(zhōng),一幅名为《太空歌(gē)剧院(yuàn)》的(de)作品获(huò)奖。

随(suí)后各大厂商(shāng)的AI绘(huì)画软件(jiàn)被广大(dà)网友熟知(zhī)并体验,Stable Diffusion便是其中代表(biǎo)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入(rù)可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量(liàng)

用户们可以在(zài)应用中输入一(yī)组关键词(cí)或者一张照片,就能获得(dé)一幅(fú)AI创作的画作(zuò)。

作画的关键就是所输入的(de)文(wén)本。同一组关键词(cí)也(yě)可以创作出很多张风(fēng)格不一(yī)样(yàng)的画作(zuò),这(zhè)让创作的过程就像(xiàng)开盲(máng)盒。

很多用户很喜(xǐ)欢(huān)这种不确定的惊喜(xǐ),他们会将生成的(de)美图(tú)当做头像。而另一(yī)部分喜欢(huān)翻看AI绘画的(de)“翻车(chē)”作(zuò)品。在社(shè)交媒体上,许多用(yòng)户(hù)分享AI“翻(fān)车现场”,例(lì)如,一位网友的小狗照片被AI画(huà)成了“肌肉男”,还有(yǒu)网友(yǒu)的个人(rén)照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加(jiā)持,以往AI绘(huì)画(huà)的填写关键词游戏可能要被颠覆了。

ChatGPT之后又一应(yīng)用杀疯(fēng)了(le),AIGC或进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

ControlNet是一位正在(zài)斯坦福读博的(de)中国人张(zhāng)吕(lǚ)敏创作的一种基于控制点的(de)图(tú)像变(biàn)形算法(fǎ),主要(yào)用于数字图像处理、计算(suàn)机视觉和计算机图形学等领域。

其(qí)SD插件(jiàn)一经发布(bù),在短(duǎn)短(duǎn)的两(liǎng)天(tiān)内便成为了AI绘画(huà)领域(yù)最新的(de)热点(diǎn)。

在(zài)此之前,大(dà)家用了(le)很多方法(fǎ)想让AI生成的结果(guǒ)尽可能的符合(hé)要求(qiú),但是都不尽如人意,它(tā)的(de)出现代(dài)表着AI生成开始(shǐ)进(jìn)入真正的可(kě)控时期。

因为ControlNet可以(yǐ)直接提取画面(miàn)的构图(tú),人物的姿势和画面的深度(dù)信(xìn)息等。有了(le)它的帮助,就不用频繁的用提示词来碰(pèng)运气,抽盲盒式的(de)创作了。

通俗(sú)的说ControlNet相当(dāng)于给AI绘(huì)画加了“魔(mó)法”,不少(shǎo)博主(zhǔ)的作(zuò)品已(yǐ)经获得了大量的浏览量,“viggo”就是(shì)其中之一,他(tā)用朋友(yǒu)的照片直接带她们走(zǒu)进动漫(màn)世界(jiè)。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌(pái)科技行业?_黑(hēi)料(liào)正能量

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找到对应的关键(jiàn)词;最后(hòu)用ControlNet插(chā)件绑定骨骼开始换关键词试效果(guǒ)。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

通过图片(piàn)就可(kě)以(yǐ)看出来,效(xiào)果十分(fēn)惊艳(yàn)。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将洗牌科技行业(yè)?_黑料正能量

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科技行业(yè)?_黑料(liào)正能量

更厉害的是,除(chú)了真实的(de)照片,草图也可以加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍(shào)到ControlNet还能实(shí)现线稿转全彩图(tú)。大神张吕敏其(qí)本尊也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科技行业?_黑料正能量

不得(dé)不说当下AIGC已经(jīng)变(biàn)得越来越强大,甚至(zhì)输出的(de)作品都(dōu)已经(jīng)能以(yǐ)假乱真了。

02

难(nán)辨(biàn)虚实,AIGC技术力爆发

警惕安全问题

近日(rì),“苏州金(jīn)鸡湖有游(yóu)艇party”的消(xiāo)息(xī)火遍网络,而经(jīng)过警方(fāng)辟谣这所谓的“party”可能(néng)是全国第一起AI绘图诈骗。

由于这个活动里面给出的(de)美女照片都(dōu)是AI制作的真人照片绘图,因为太逼(bī)真,被大家当成(chéng)真事传(chuán)播了

ChatGPT之(zhī)后又(yòu)一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌科技行(xíng)业?_黑料(liào)正能(néng)量

不过仔细观(guān)察可以发现,活(huó)动发起者(zhě)提供的(de)照片中(zhōng)有个(gè)很大的漏洞可(kě)以发现(xiàn)并非真(zhēn)人,而是AI绘图,那便是图片中女(nǚ)性(xìng)的手(shǒu)指(zhǐ)部(bù)分有的存在异常。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控期,将(jiāng)洗(<span style='color: #ff0000; line-height: 24px;'>两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃</span>xǐ)牌(pái)科(kē)技行业?_黑料正能(néng)量(liàng)

有行(xíng)业(yè)人事表示:“现(xiàn)在因为(wèi)手(shǒu)指部分的(de)绘(huì)画(huà)算法比较复杂,AI还不(bù)太(tài)会画人(rén)的手,但最新(xīn)看到的(de)图片已(yǐ)经有(yǒu)越来越完美的AI模型出现,以后(hòu)可能就(jiù)完(wán)全没(méi)有漏(lòu)洞了。

类似的AI作(zuò)图诈骗在(zài)国(guó)外也已(yǐ)有发生。据英(yīng)国广播公司报道(dào),土耳其地震期间,有Tiktok用户使用AI合成了儿童受(shòu)灾的假照片发(fā)布(bù)到网络,以此诱骗善良的人打赏“捐助(zhù)”从而实施(shī)诈(zhà)骗(piàn)。

目(mù)前随着(zhe)技术发展,AIGC已(yǐ)经(jīng)能做出真人照片般的(de)绘图(tú)效果,如果这(zhè)样的图片被(bèi)用来诈骗,将非常可怕。

此外AIGC还引发了很(hěn)多(duō)担忧,一方(fāng)面,批(pī)判者(zhě)认为AI在(zài)“学习”了大量前人的作品之后,其创作(zuò)没有任何情绪和灵魂,难以和人类的艺术(shù)创(chuàng)作相(xiāng)提(tí)并论(lùn)。

另一方面,AIGC背后(hòu)的版权、目前都并没有(yǒu)得到有效的解决,还有AIGC会不会代替人类“至高无上”的创意(yì)。

马斯克也强(qiáng)调,人工智能的安全问题需要得到重视,太晚就来不及了。

03

AIGC下(xià)一站除了视(shì)频,还有远方

技术都是有两面性的,潜在的(de)危害(hài)并不能掩盖(gài)其光辉的贡献(xiàn)。现在看(kàn)来,人工智能技(jì)术将是(shì)第(dì)四次工(gōng)业革命(mìng)的核心(xīn)驱动力量,将创造新(xīn)的增长奇迹。

过去一(yī)年,人工智能在技术和商业层面都(dōu)有了巨大进展,AI绘画就是(shì)人工智能技术发生方向性改变的(de)一个代表。其下一(yī)站或许(xǔ)就是视频。

此前,Meta和谷歌先后发布了几(jǐ)条引(yǐn)爆科技圈(quān)的短(duǎn)视频。这些视频引发关注并非(fēi)内(nèi)容做得(dé)多优秀(xiù),反而都非常简单(dān),比如一匹正(zhèng)在喝水的马,一(yī)只画(huà)画的玩具熊,或者一(yī)段骑摩托(tuō)车的第一视角(jiǎo)录像,随便一个(gè)有(yǒu)手(shǒu)机的人都可以随手录下一段。

ChatGPT之(zhī)后又一应(yīng)用(yòng)杀疯(fēng)了,AIGC或进入(rù)可控(kòng)期(qī),将洗牌科技行业?_黑(hēi)料正(zhèng)能量

但这(zhè)些短视频(pín)的创作方式非(fēi)常(cháng)简单,创作者仅仅需要(yào)向AI输入(rù)一段(duàn)话,甚至(zhì)只(zhǐ)是说一(yī)下要求(qiú),AI就可以根(gēn)据需要生成一(yī)段视频。

谷歌发布(bù)的两个(gè)AI生成视频分别来自于Imagen Video和Phenaki,前者(zhě)主要(yào)突出的是高清,与Meta的Make-A-Video没有(yǒu)太多的差别(bié)。

在Make-A-Video公布了(le)AI生成的(de)视频(pín)后(hòu),AI圈就已经玩了一波梗,一个能够做(zuò)出更高清视频的AI还不足以在(zài)短时间(jiān)内戳中(zhōng)兴奋点。

Phenaki更加(jiā)令人(rén)震惊的地(dì)方在于(yú),它可以制作出超过2分钟的连贯的也有确切内容的(de)视频,这才(cái)是真正让人们感到(dào)惊喜(xǐ)的地方(fāng)。因为无论AI生(shēng)成的视频(pín)多么高清,也只能是为内容生产者提(tí)供一个(gè)灵感,一(yī)个素材,一(yī)个过场动(dòng)画。

不过(guò)能够制(zhì)作出有具体剧(jù)情(qíng)内容的视频就意味着,一些视(shì)频(pín)创作由(yóu)AI代(dài)替人工完成已经初步有了可能。

当下AI的(de)发展速度已经超过大部分人的想象(xiàng)。内容产业的本质(zhì)是供给(gěi)创造需求,AIGC作为全新(xīn)的内容生产方式,可(kě)以为内容产业带来更新的内(nèi)容风格(gé)、更快的(de)生产速度,更低的生产(chǎn)成本,这(zhè)无(wú)疑会驱动内(nèi)容产业的(de)大爆发。

除了AI绘图、视频,AIGC技术(shù)还能应用于音乐、代码(mǎ)、机器(qì)人动作等(děng)多(duō)种(zhǒng)内容形式的(de)生成(chéng)。不难发现该项技术不仅在游戏等行业(yè)能得到有效应(yīng)用,对于(yú)下一代互联(lián)网各种元素的构建亦有关键意义(yì)。

从(cóng)商业(yè)化的角(jiǎo)度来看,文(wén)化娱乐、教育(yù)、传媒等诸多领域,本身就对基于AI的可视(shì)化内容有强(qiáng)烈需求。

因此,AI绘画及视频或不是(shì)结果,而(ér)只是AI进程中的一块重要拼图,有望在(zài)技术(shù)更新的加持下实(shí)现更大(dà)的应用价值。

AI从(cóng)理解内容,走(zǒu)向了(le)可以生(shēng)成内容,甚至能(néng)够创造出(chū)独立(lì)价值和(hé)独(dú)立视角的内容。AIGC的(de)再次出圈(quān),更代表着未来的先进生产力(lì)即将到来。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行(xíng)业?_黑料正能(néng)量

04

紧抓大模型与算力,牢固AIGC底座

从技术的发展也(yě)可以看(kàn)出,在语言大模型(xíng)、图像大(dà)模型之后,多模态大模型已经成(chéng)为了新的趋势。

大模型被誉为当(dāng)前人工智(zhì)能(néng)发展的智能底座,是全球(qiú)竞(jìng)争最激烈的(de)研(yán)究(jiū)方向之一,包括(kuò)谷(gǔ)歌、亚马(mǎ)逊、百度、阿里、腾(téng)讯等(děng)众多头部企业都在竞相发(fā)力(lì)。

不过(guò)训练(liàn)大模型的(de)确价格不菲,以国盛证券发布的《ChatGPT需(xū)要多少算力》报告估算,GPT-3训练(liàn)一次的成本约为140万美元。而对于(yú)一些更大的(de)LLM(大型(xíng)语言模型),训练(liàn)成本则介(jiè)于200万美元至(zhì)1200万美元高价之间。

以(yǐ)ChatGPT在2023年1月的独立访客(kè)平均(jūn)数1300万计算,其对应芯片(piàn)需求为3万多(duō)片英伟达(dá)A100 GPU,初始投(tóu)入成本约为8亿美元,每日仅(jǐn)电(diàn)费就(jiù)在(zài)5万美(měi)元左右。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进(jìn)入可控期,将洗牌科技行业?_黑料正能(néng)量

此外不论是ChatGPT还是AIGC,都离不开庞大算力(lì)支持。在关注各类大模型的(de)发展同时,更应(yīng)该关注(zhù)算(suàn)力网络的建设。

算力网络正(zhèng)驱(qū)动AI产业发展(zhǎn)进入史诗级加速进(jìn)程(chéng),让AIGC及通用AI这一人工智能发(fā)展的终极目标离(lí)得更近。

因为算力可以(yǐ)对突破性(xìng)技术创(chuàng)新提供大力的(de)支持。这方面,多模态大模型是典型(xíng)。作为(wèi)面向未来强人工智能(néng)、通用人工智能的重要技术(shù)创新,多模(mó)态大模型已经在人(rén)工智(zhì)能领域提出了很多年,业界也有不少技(jì)术突(tū)破,但是,多模态大模型进一步往下走,算力需求呈几(jǐ)何式上升,一般的算力(lì)基础设施很快将难以(yǐ)胜任。

从图像(xiàng)、文字、语(yǔ)音单独一项(xiàng)的训练,到双模态、三模态的跃迁,让人(rén)工智能可以灵(líng)活应对不同模态(tài)的转化、像人与(yǔ)世(shì)界(jiè)交互(hù)一样自(zì)然,这方面(miàn),由(yóu)算力网(wǎng)络来驱动(dòng)将有明显优势。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗(xǐ)牌科技行(xíng)业?_黑料正能(néng)量(liàng)

此外,还有(yǒu)很多需要(yào)爆(bào)发式增长的(de)算(suàn)力来支撑的(de)技术创新,将在人工智能(néng)算(suàn)力网络支撑下(xià)快速(sù)推进。

AIGC已经露出曙光(guāng),期待在大模型和大算力的(de)支持下(xià)AIGC能(néng)持续颠覆内(nèi)容生产(chǎn)的(de)方式,将创造的边际成本降(jiàng)低(dī),让(ràng)万众受益。

未经允许不得转载:橘子百科-橘子都知道 两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃

评论

5+2=