橘子百科-橘子都知道橘子百科-橘子都知道

三眼蟹为什么有三个眼,三眼蟹为什么有三个眼睛

三眼蟹为什么有三个眼,三眼蟹为什么有三个眼睛 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机器人ChatGPT火爆以来,微软公司创始人比尔·盖茨已多次公开(kāi)谈论人工智(zhì)能话题。在最近的一(yī)次采访中,他再次表示:“AI可能(néng)会让科技行业(yè)迎来一次剧烈的洗牌”。

这(zhè)个结论是他在当(dāng)地时间2月20日接受(shòu)《In Good Company》节目专访时提出的(de)。

他预期,AI的发展(zhǎn)可能会威胁到(dào)谷歌(gē)的市(shì)占率,因为(wèi)微(wēi)软(ruǎn)在AI方面的行动(dòng)相当迅速。而最终科技巨(jù)头将把AI整合成用(yòng)户的“全能助手(shǒu)”,包揽一切(qiè)应用(yòng),与人们进行沟通并(bìng)提供(gōng)建议,可以取(qǔ)代亚(yà)马逊、Siri或Outlook等应用。

大佬口中全(quán)能助手的到来可能尚需时日(rì),但由ControlNet引(yǐn)发的又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点(diǎn)包围(wéi)中(zhōng)杀出重围。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进(jìn)入可控(kòng)期,将洗(xǐ)牌科技行业?_黑料(liào)正(zhèng)能量(liàng)

01

ControlNet颠(diān)覆AI绘画新(xīn)玩(wán)法

AIGC向可控(kòng)靠(kào)近

以(yǐ)AI绘画为代表的(de)AIGC上一次爆火(huǒ)的时候,还是2022年(nián)8月,在美国科罗拉(lā)多州举办的新兴(xīng)数字艺术(shù)家竞赛中,一幅名为《太空歌(gē)剧院》的作(zuò)品获奖。

随后各大(dà)厂商的(de)AI绘画(huà)软件被广(guǎng)大(dà)网友熟知并体(tǐ)验,Stable Diffusion便是其中代表。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行(xíng)业?_黑(hēi)料正能量(liàng)

用(yòng)户们(men)可以在应用中(zhōng)输入(rù)一组关(guān)键词或者一张照(zhào)片,就能获得一幅AI创(chuàng)作的画作。

作画的关(guān)键就(jiù)是所(suǒ)输入的文本。同(tóng)一组关键词也可以创作出(chū)很多张风格不一样的画作,这让创作的(de)过(guò)程就像开盲(máng)盒。

很多用户(hù)很喜欢这(zhè)种不确定的惊喜,他(tā)们会(huì)将生成的美图当(dāng)做头像。而(ér)另一部分喜欢翻看AI绘画的“翻车”作品。在社交媒(méi)体(tǐ)上,许(xǔ)多用户分享AI“翻车现(xiàn)场(chǎng)”,例如,一位(wèi)网(wǎng)友(yǒu)的小狗照片被(bèi)AI画成了“肌(jī)肉男”,还有网(wǎng)友的个人照(zhào)片被AI识别(bié)成了建筑。

而如今随着ControlNet的出现与(yǔ)加(jiā)持,以往AI绘(huì)画的(de)填写关键词游戏可能要被(bèi)颠覆(fù)了。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

ControlNet是一位正在斯坦福读博(bó)的中国人张吕敏创作的一种基(jī)于控制点的图像(xiàng)变形算法,主要用于(yú)数字图像处理、计算机视觉和计(jì)算机图形学等领域。

其SD插件(jiàn)一经发布,在短短的两天内(nèi)便成为了AI绘画领域最新的热点。

在此之前,大家(jiā)用了(le)很多(duō)方法想让AI生成的结果尽可能的符合(hé)要求(qiú),但是都不尽如人意,它的出(chū)现代表着AI生(shēng)成开始(shǐ)进入(rù)真正的(de)可控时期。

因为ControlNet可以直接提取(qǔ)画(huà)面(miàn)的构图,人物的姿(zī)势和画面的深度(dù)信息等。有了它(tā)的帮助,就不(bù)用频繁(fán)的(de)用(yòng)提示词来(lái)碰运气,抽(chōu)盲盒式的创作了(le)。

通俗的说ControlNet相(xiāng)当于给(gěi)AI绘画加了(le)“魔法”,不少博主的(de)作品已经获(huò)得(dé)了大量(liàng)的浏览量,“viggo”就是其中之一,他(tā)用朋友(yǒu)的照片直接(jiē)带她(tā)们走进动(dòng)漫世界。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

viggo先用StableDiffusion图片转(zhuǎn)文(wén)字。

再用Text2Prompt插件拓展(zhǎn)找(zhǎo)到对(duì)应(yīng)的(de)关键(jiàn)词;最后用ControlNet插件绑定骨骼开始(shǐ)换关键(jiàn)词试效果(guǒ)。

ChatGPT之后(hòu)又一应用(yòng)杀疯了(le),AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

通过(guò)图片(piàn)就可以看出来,效果(guǒ)十分惊艳(yàn)。

ChatGPT之(zhī)后(hòu)又一应用杀疯(fēng)了,AIGC或进入(rù)可(kě)控期(qī),将(jiāng)洗牌科技行业?_黑料正能量(liàng)

ChatGPT之后(hòu)又(yòu)一应用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌科技(jì)行业(yè)?_黑料(liào)正(zhèng)能量

更厉害的是,除了真实的照片(piàn),草图(tú)也(yě)可以加上(shàng)“魔法”,知(zhī)乎大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现线稿(gǎo)转全彩图。大神张吕敏其(qí)本尊也(yě)亲自回(huí)应(yīng)。

ChatGPT之<span style='color: #ff0000; line-height: 24px;'>三眼蟹为什么有三个眼,三眼蟹为什么有三个眼睛</span>(zhī)后又一应用(yòng)杀疯(fēng)了,AIGC或(huò)进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能量

不得不说当下(xià)AIGC已经变得(dé)越来越强大,甚至输出的(de)作品都已(yǐ)经(jīng)能以假乱(luàn)真了。

02

难辨虚实,AIGC技术力(lì)爆发

警惕安全问题

近(jìn)日,“苏州(zhōu)金鸡湖有游艇party”的消(xiāo)息(xī)火(huǒ)遍网络,而经过警方辟谣(yáo)这(zhè)所谓的“party”可能是全国第一(yī)起AI绘图诈(zhà)骗(piàn)。

由于这(zhè)个活(huó)动里面给(gěi)出的美(měi)女照片(piàn)都是AI制作的真(zhēn)人(rén)照片绘(huì)图(tú),因为太逼(bī)真(zhēn),被大(dà)家当(dāng)成真事传播了

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

不过仔细观察可(kě)以发现,活动发起者(zhě)提(tí)供的照片中有个很大的漏洞可以(yǐ)发现(xiàn)并非真人,而是AI绘图,那便是图(tú)片(piàn)中(zhōng)女(nǚ)性的手指部分有(yǒu)的存在(zài)异常。

ChatGPT之(zhī)后又一应用杀(shā)疯了(le),AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正(zhèng)能量

有行业(yè)人事表示(shì):“现(xiàn)在因为手指部(bù)分(fēn)的绘画算(suàn)法比较(jiào)复杂,AI还不太会画人的手,但最新看到的图(tú)片(piàn)已(yǐ)经有(yǒu)越(yuè)来越完(wán)美(měi)的AI模型出现,以(yǐ)后可能就完全(quán)没有漏洞了。

类似的AI作图(tú)诈骗在国外(wài)也(yě)已有发生。据英国(guó)广播公司(sī)报道,土耳其地震期间(jiān),有Tiktok用户使用(yòng)AI合成了儿(ér)童受(shòu)灾的假照片发布到网络,以此诱骗善良的人打赏“捐助”从而实施诈(zhà)骗。

目前随着技术发展,AIGC已经能做出真人(rén)照片般的(de)绘(huì)图效果,如果这样的图片被用来诈骗,将非常可怕。

此外(wài)AIGC还(hái)引发了很(hěn)多(duō)担忧(yōu),一方面,批判者认(rèn)为AI在“学习”了大量前人的作品之后,其创作没有任何(hé)情绪(xù)和灵魂,难以和人(rén)类的艺术创(chuàng)作相提并论。

另一方面(miàn),AIGC背(bèi)后(hòu)的版权、目前都并没有(yǒu)得(dé)到有效的解(jiě)决,还有AIGC会不会代替人类“至高无上”的创意。

马斯克也强调(diào),人工智能(néng)的(de)安全问题需要(yào)得到重视(shì),太晚(wǎn)就来(lái)不(bù)及(jí)了。

03

AIGC下一站除了视频,还(hái)有远方

技术(shù)都是有(yǒu)两面性(xìng)的,潜在的危害(hài)并不(bù)能掩盖其(qí)光辉的贡(gòng)献。现在看来,人工智能技术(shù)将是第四次工(gōng)业革(gé)命(mìng)的核心驱动力量,将创造新的增长奇迹。

过去一年,人工智能在(zài)技术和商业层面都(dōu)有了巨(jù)大进展,AI绘画就是人工智能(néng)技术(shù)发(fā)生(shēng)方向性(xìng)改变的一个(gè)代(dài)表。其下(xià)一站或(huò)许就是视频。

此前,Meta和谷歌先后发布了几条引爆科技(jì)圈的短视频。这些(xiē)视频引发(fā)关注并非内容做得多优(yōu)秀(xiù),反而都非常简(jiǎn)单(dān),比(bǐ)如一匹正在喝水(shuǐ)的(de)马(mǎ),一只(zhǐ)画画的玩具熊(xióng),或者(zhě)一段(duàn)骑摩托车(chē)的第一视角录(lù)像(xiàng),随(suí)便一个有手机的人都可以随(suí)手录(lù)下一段。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控期,将洗牌科技行业(yè)?_黑料正能量

但(dàn)这(zhè)些(xiē)短视(shì)频(pín)的创作方式非(fēi)常(cháng)简单,创作者仅仅需要向(xiàng)AI输入(rù)一段话,甚至只是(shì)说一(yī)下要求,AI就(jiù)可以根据需要生成一段视(shì)频(pín)。

谷歌发布的两个AI生成(chéng)视频分别来自于(yú)Imagen Video和Phenaki,前者主要突出的(de)是高清(qīng),与Meta的Make-A-Video没(méi)有(yǒu)太多(duō)的差别。

在Make-A-Video公布了(le)AI生(shēng)成的视频后,AI圈(quān)就已经(jīng)玩(wán)了一波梗,一(yī)个能够做出更高清视频的AI还(hái)不足(zú)以在短(duǎn)时间内戳(chuō)中(zhōng)兴(xīng)奋(fèn)点。

Phenaki更加令人震惊的(de)地(dì)方在(zài)于,它可(kě)以制作出超(chāo)过2分钟的(de)连贯的也有确切内(nèi)容的视(shì)频,这才是真正让人们感(gǎn)到惊(jīng)喜的地(dì)方。因为无(wú)论AI生成的(de)视频多么高清,也(yě)只能是为内容(róng)生产者提供一(yī)个灵感,一个素材,一个过(guò)场动画。

不过能够制(zhì)作(zuò)出有具体剧(jù)情内容的视频就意(yì)味着,一些视频(pín)创作由AI代替(tì)人工完成已经初(chū)步有了可能(néng)。

当下AI的发展速度已经超过大(dà)部(bù)分人的(de)想象。内容产(chǎn)业的本质是(shì)供给(gěi)创(chuàng)造需求,AIGC作(zuò)为(wèi)全新的(de)内容生产方式,可以为(wèi)内容产(chǎn)业带来更新(xīn)的内容风格、更快的生产速(sù)度,更(gèng)低的(de)生产成本,这无疑(yí)会驱动内容(róng)产(chǎn)业的大爆发(fā)。

除(chú)了AI绘图、视频(pín),AIGC技术还能应用于音(yīn)乐、代码、机器人动作等多种内容形(xíng)式(shì)的生成(chéng)。不难发现该项技(jì)术不仅(jǐn)在游(yóu)戏等行业能得(dé)到(dào)有效应用(yòng),对于下一(yī)代互(hù)联网各种元素的构建亦有关键意义。

从商业(yè)化的角度来看,文(wén)化娱乐、教育、传媒等诸多领域,本(běn)身(shēn)就对基于AI的可视化内容有(yǒu)强烈(liè)需求。

因此,AI绘(huì)画及视频(pín)或不是结果,而只是(shì)AI进程中的一块重(zhòng)要拼图(tú),有望在技术更新的加持下实现更大(dà)的应(yīng)用(yòng)价值。

AI从理解内容,走向了可以生成内容(róng),甚至能够创造出独立价值和(hé)独(dú)立(lì)视角的内容。AIGC的再次出圈,更(gèng)代表(biǎo)着(zhe)未(wèi)来(lái)的先(xiān)进生产(chǎn)力即将(jiāng)到来。

ChatGPT之后又一(yī)应(yīng)用杀疯(fēng)了,AIGC或进入(rù)可(kě)控期,将洗牌科技行业?_黑料(liào)正能量

04

紧抓大(dà)模型与算(suàn)力,牢固AIGC底座

从技(jì)术的发展也可以看(kàn)出,在(zài)语言大模(mó)型(xíng)、图像(xiàng)大(dà)模型(xíng)之后,多模态大模型已(yǐ)经成为了新的趋势。

大模型被誉为当前人工智能发展的智能底(dǐ)座,是全球竞(jìng)争最激烈的研(yán)究方向之一(yī),包括谷(gǔ)歌、亚马逊、百度(dù)、阿里、腾讯等众多头部企业都在(zài)竞相发(fā)力。

不过(guò)训练大模型(xíng)的确价格(gé)不(bù)菲,以国(guó)盛(shèng)证券(quàn)发布的《ChatGPT需要(yào)多少算力》报告估算,GPT-3训练一(yī)次的成本约为140万美元。而(ér)对于(yú)一些更大的(de)LLM(大(dà)型语言模型(xíng)),训练(liàn)成本则介于200万美元至1200万美(měi)元高价(jià)之间。

以ChatGPT在2023年(nián)1月(yuè)的独(dú)立(lì)访客(kè)平均(jūn)数1300万计算,其对应芯片需求(qiú)为3万多片英伟(wěi)达A100 GPU,初始投入(rù)成本约为8亿(yì)美元(yuán),每日仅电费(fè三眼蟹为什么有三个眼,三眼蟹为什么有三个眼睛i)就在5万美(měi)元左右。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期(qī),将洗牌(pái)科(kē)技行业?_黑料(liào)正能量(liàng)

此外不论是ChatGPT还是AIGC,都离不开(kāi)庞大(dà)算力支(zhī)持(chí)。在关注各类大模型的发(fā)展同时,更应(yīng)该关(guān)注算(suàn)力网(wǎng)络的建设(shè)。

算(suàn)力网络(luò)正驱动AI产业发展进入史诗(shī)级加(jiā)速进(jìn)程,让AIGC及(jí)通用AI这一人工智能发展的终极目标离得更近。

因(yīn)为算(suàn)力可以对突(tū)破(pò)性技术创新提供大(dà)力的支持。这方面(miàn),多模(mó)态大模型是典型。作为面向未来强(qiáng)人工智能、通用人工(gōng)智能的重要技术创新,多(duō)模(mó)态大模(mó)型已经在人工智(zhì)能领(lǐng)域(yù)提出了很多(duō)年,业界也有不少技术(shù)突破(pò),但是,多模态大(dà)模型进一步往下(xià)走,算力需求(qiú)呈几何式(shì)上升,一般的(de)算(suàn)力(lì)基础设施(shī)很快将难以胜任。

从图像、文字(zì)、语音单独一(yī)项(xiàng)的训练(liàn),到双(shuāng)模态、三模态的(de)跃迁(qiān),让(ràng)人(rén)工智能可以灵活(huó)应对(duì)不同模态的转(zhuǎn)化(huà)、像人(rén)与世界交(jiāo)互(hù)一样自然,这方面,由(yóu)算力网络来(lái)驱动将有明显优(yōu)势。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行(xíng)业?_黑料正能量(liàng)

此外,还有很多需要(yào)爆发式增长的(de)算力来支撑的(de)技术(shù)创新,将在(zài)人工智(zhì)能算(suàn)力网(wǎng)络支撑(chēng)下快速(sù)推进。

AIGC已经露出曙光,期待(dài)在(zài)大模型和大算力的(de)支持下AIGC能持续颠覆内容生产的方式,将创造的(de)边际(jì)成本降低,让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 三眼蟹为什么有三个眼,三眼蟹为什么有三个眼睛

评论

5+2=