橘子百科-橘子都知道橘子百科-橘子都知道

作出指示和做出指示区别在哪,作出指示还是做出

作出指示和做出指示区别在哪,作出指示还是做出 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火(huǒ)爆以来,微软公司创始人比尔(ěr)·盖茨已多次公开谈论人工智能话(huà)题。在最(zuì)近的(de)一次采访中,他再(zài)次表示:“AI可能会让(ràng)科技行业迎来一次剧烈(liè)的洗(xǐ)牌”。

这个结论是他在当地时间2月20日接受《In Good Company》节目专访时提出的。

他预期(qī),AI的发展可能会威胁到谷(gǔ)歌的(de)市占率,因为微软(ruǎn)在AI方(fāng)面的行动相当(dāng)迅速。而最终科技(jì)巨头将把AI整合(hé)成用户的“全能助手(shǒu)”,包揽一切(qiè)应用,与人们(men)进行沟通并提(tí)供建议(yì),可以取代亚马(mǎ)逊(xùn)、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到(dào)来可能尚需时(shí)日,但(dàn)由ControlNet引发(fā)的(de)又一次AI绘(huì)画(huà)浪(làng)潮,让AIGC在ChatGPT的话题热(rè)点包围(wéi)中(zhōng)杀出重围。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可(kě)控(kòng)期,将洗(xǐ)牌科技(jì)行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠(kào)近

以AI绘画为代表(biǎo)的AIGC上一次爆火的时候,还是2022年8月,在美国(guó)科罗(luó)拉(lā)多(duō)州举办的新兴数字艺术家(jiā)竞(jìng)赛(sài)中(zhōng),一幅名为《太空歌剧院》的(de)作品获奖。

随后各大厂商的AI绘画软件被广大网友熟知(zhī)并体验,Stable Diffusion便是(shì)其中代(dài)表。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科技行业?_黑料(liào)正(zhèng)能(néng)量

用户(hù)们可(kě)以在应(yīng)用中(zhōng)输入一组关键词或者一(yī)张照片,就能获得一(yī)幅(fú)AI创作的(de)画作。

作(zuò)画的关键就是所(suǒ)输入的文本。同一组关(guān)键词也可以创(chuàng)作出(chū)很多张风格不一样的(de)画作,这让创作的过程(chéng)就像开盲盒。

很(hěn)多用户很(hěn)喜欢这种(zhǒng)不确定的惊(jīng)喜,他们会将(jiāng)生(shēng)成的美图当做(zuò)头像。而(ér)另一部分喜欢(huān)翻(fān)看AI绘画的“翻车”作品。在社交媒体上(shàng),许多用户分享AI“翻车现场”,例如,一位网友的(de)小(xiǎo)狗(gǒu)照(zhào)片被(bèi)AI画成了“肌肉男”,还有网友的个(gè)人照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加持,以往AI绘画的填(tián)写关键(jiàn)词游戏可能要(yào)被颠(diān)覆了。

ChatGPT之后(hòu)又一应(yīng)用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能(néng)量

ControlNet是一(yī)位正在斯(sī)坦(tǎn)福读博的中(zhōng)国(guó)人张吕敏创作(zuò)的一种基于控制点的图像变形算法,主要用于(yú)数(shù)字(zì)图像处理、计算(suàn)机视觉和计(jì)算(suàn)机图形学等领域。

其SD插件(jiàn)一经发(fā)布,在短短的两天内便(biàn)成为了(le)AI绘画领域(yù)最新的热点。

在(zài)此之(zhī)前,大(dà)家用了很多方法想让AI生(shēng)成的结果尽(jǐn)可能(néng)的符合要求,但是都不尽如(rú)人意,它的出(chū)现(xiàn)代表着AI生成开始进入真正的可控时期。

因为ControlNet可以直接提取画面(miàn)的(de)构图,人物的姿势和(hé)画(huà)面的(de)深度(dù)信息(xī)等。有了它的帮(bāng)助(zhù),就不(bù)用频繁的(de)用提示词来碰运气,抽盲盒式的创作了。

通(tōng)俗的说ControlNet相当(dāng)于给AI绘画(huà)加了“魔法(fǎ)”,不少博主的作品已(yǐ)经获得(dé)了大量(liàng)的浏览量(liàng),“viggo”就(jiù)是其中(zhōng)之(zhī)一,他用朋友的照片直接带(dài)她(tā)们走(zǒu)进(jìn)动漫世界(jiè)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科(kē)技行(xíng)业(yè)?_黑料正能量(liàng)

viggo先用StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展(zhǎn)找到对应的(de)关(guān)键词;最后用ControlNet插件(jiàn)绑定骨骼开始(shǐ)换(huàn)关键词试效(xiào)果。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料正能(néng)量(liàng)

通过图片就可(kě)以看出来,效(xiào)果(guǒ)十(shí)分惊艳(yàn)。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可控期,将(jiāng)洗牌科技(jì)行业(yè)?_黑料正能量

ChatGPT之(zhī)后(hòu)又一应(yīng)用杀(shā)疯(fēng)了,AIGC或进(jìn)入可(kě)控期(qī),将洗牌科技行业?_黑料(liào)正(zhèng)能量(liàng)

更厉害(hài)的是(shì),除了真实的照片,草图也可以(yǐ)加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转全彩(cǎi)图。大(dà)神张(zhāng)吕敏其本尊(zūn)也亲自回应。

ChatGPT之后(hòu)又一应(yīng)用杀(shā)疯了(le),AIGC或进入(rù)可控(kòng)期,将洗牌科技(jì)行业?_黑料正能量

不得不说当下AIGC已经变得越来越强(qiáng)大,甚至输(shū)出(chū)的作品都已经(jīng)能(néng)以假乱真了。

02

难辨虚实,AIGC技(jì)术力爆发(fā)

警惕安全问题

近日,“苏(sū)州金鸡湖有游艇party”的消息(xī)火遍网络,而经过警方辟谣这所谓的“party”可能是全国(guó)第一起AI绘图(tú)诈(zhà)骗(piàn)。

由于这个活动里面(miàn)给(gěi)出的美女(nǚ)照片都是(shì)AI制作(zuò)的真人照片(piàn)绘(huì)图,因为太逼真,被大家(jiā)当成真事传(chuán)播(bō)了

ChatGPT之后又一(yī)应用杀疯了,AIGC或(huò)进(jìn)入可控期(qī),将洗牌科(kē)技行业?_黑料正(zhèng)能(néng)量

不过仔细观察可以发现,活动(dòng)发起者提供的照片中(zhōng)有个很大的漏洞可以发(fā)现(xiàn)并非真人,而是(shì)AI绘图,那便是图片中(zhōng)女性(xìng)的(de)手指部(bù)分有(yǒu)的存(cún)在异常。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量

有(yǒu)行业人事表示(shì):“现在因为手指部分的绘画算(suàn)法比较复杂,AI还不太会画(huà)人的手(shǒu),但最新(xīn)看到(dào)的图片(piàn)已经有越来越(yuè)完美的AI模型(xíng)出现,以后可能就完全(quán)没有漏洞了(le)。

类似的AI作图诈(zhà)骗在国外也已有发生。据英国(guó)广播公司报(bào)道,土耳其地震期间,有Tiktok用(yòng)户使用AI合(hé)成了(le)儿童受灾的假照片发布到网络,以(yǐ)此诱骗善良(liáng)的(de)人(rén)打赏(shǎng)“捐助”从而实(shí)施诈(zhà)骗。

目(mù)前随(suí)着技术发展,AIGC已经(jīng)能(néng)做出(chū)真(zhēn)人照片般的绘图效果(guǒ),如果这样的图片被用来诈骗,将非常可怕。

此外AIGC还引发(fā)了(le)很多担忧(yōu),一(yī)方面,批判者认为AI在“学习”了大量前人的作(zuò)品之后,其创作(zuò)没有(yǒu)任何情绪和灵(líng)魂,难以和人类(lèi)的艺术创作相提并论。

另一方(fāng)面,AIGC背后的版权、目(mù)前都并没有(yǒu)得到有效的解决,还有AIGC会不会代替人类“至高无上”的创意。

马斯克也强(qiáng)调,人工智(zhì)能(néng)的安全问题(tí)需要得到重视(shì),太(tài)晚就来(lái)不及了。

03

AIGC下一(yī)站除了(le)视频,还有远方作出指示和做出指示区别在哪,作出指示还是做出ong>

技术都是有两面性的,潜在(zài)的(de)危害并不能(néng)掩盖其光(guāng)辉(huī)的贡献。现在看(kàn)来(lái),人(rén)工智能技术将是第四次工业革命的核心驱动力量,将创造新的(de)增长奇(qí)迹。

过去一年,人工(gōng)智(zhì)能在(zài)技术(shù)和商业层面(miàn)都(dōu)有了巨大进展,AI绘画就是(shì)人(rén)工智(zhì)能技术发生方(fāng)向性改变的一个(gè)代表。其下(xià)一(yī)站或许(xǔ)就(jiù)是视频(pín)。

此前,Meta和谷歌先后发(fā)布了几条引爆科技(jì)圈(quān)的短视频。这些(xiē)视频(pín)引发关注并非(fēi)内容(róng)做得多优秀,反而(ér)都(dōu)非常(cháng)简单,比如一匹正在喝水的(de)马,一(yī)只画画(huà)的玩(wán)具熊,或(huò)者一段骑(qí)摩托车的第一视角录像,随(suí)便(biàn)一(yī)个有手机的人都(dōu)可以随手录下一段(duàn)。

ChatGPT之(zhī)后又一应用(yòng)杀(shā)疯了,AIGC或进(jìn)入(rù)可控期(qī),将洗牌科技行业?_黑料正能(néng)量

但这些短视频的(de)创作(zuò)方(fāng)式非常简单,创作者仅仅需要向AI输入一段话,甚至只是说一下要求,AI就可以根(gēn)据(jù)需(xū)要(yào)生成一段视频。

谷歌发布的两个AI生成(chéng)视频分别来自于(yú)Imagen Video和Phenaki,前者主要突出的是(shì)高(gāo)清,与Meta的Make-A-Video没有太(tài)多的差别(bié)。

在(zài)Make-A-Video公布了AI生成的视频后,AI圈就已经玩了一波梗(gěng),一个能(néng)够做出更高清(qīng)视频的AI还不足以(yǐ)在短时间内(nèi)戳中兴奋点(diǎn)。

Phenaki更加(jiā)令人震惊(jīng)的地方在于,它可(kě)以制作出超(chāo)过2分钟的连(lián)贯的也有(yǒu)确切内(nèi)容(róng)的视频,这才是真(zhēn)正让人们感到惊喜(xǐ)的地方(fāng)。因(yīn)为无(wú)论AI生成的(de)视频(pín)多么高清,也只(zhǐ)能是为(wèi)内容生产者提供一(yī)个灵感,一(yī)个素材,一个过(guò)场动(dòng)画(huà)。

不过能够(gòu)制作出有具(jù)体剧情(qíng)内容的视频就意味(wèi)着,一些视频创作(zuò)由AI代(dài)作出指示和做出指示区别在哪,作出指示还是做出替人工完成已经(jīng)初步(bù)有了(le)可能。

当下AI的发展速度(dù)已(yǐ)经超(chāo)过大部分人的想象(xiàng)。内容(róng)产业的本质是供给创造需(xū)求,AIGC作为全新的内(nèi)容生产方式(shì),可以为内(nèi)容产业带来更新的内容风(fēng)格、更快的生产速度,更低的(de)生(shēng)产成(chéng)本,这无疑会驱动内容(róng)产业的(de)大爆(bào)发。

除了(le)AI绘图(tú)、视频,AIGC技术(shù)还能应用(yòng)于音乐、代码、机(jī)器(qì)人动作(zuò)等多(duō)种内容形式的生成。不难发现该项技术不仅在游(yóu)戏等行业能得(dé)到有效应用,对于下一代互联网各种元素的构建亦有关键(jiàn)意义。

从商业化的角度来看,文化娱乐、教育、传媒(méi)等诸多领(lǐng)域,本身就对(duì)基于AI的可视化内容(róng)有(yǒu)强烈需(xū)求(qiú)。

因此(cǐ),AI绘画及视频或不是结果(guǒ),而(ér)只是AI进程中的一块重(zhòng)要(yào)拼图,有望在技术更新的加持下实现更大(dà)的应用价值。

AI从(cóng)理解内容,走向了可以生成(chéng)内容,甚至能够创造出(chū)独(dú)立价(jià)值和(hé)独立视角的内容。AIGC的再次(cì)出圈(quān),更(gèng)代表着(zhe)未来的先进(jìn)生产力即将到来。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或(huò)进入(rù)可(kě)控期,将洗牌科技行(xíng)业?_黑料正能量

04

紧抓大(dà)模型与算力,牢固AIGC底座(zuò)

从(cóng)技术的(de)发展也可以看(kàn)出,在语言大模(mó)型、图像大模型之后,多(duō)模(mó)态大模型已经成为了新(xīn)的(de)趋势。

大(dà)模型被誉为当前(qián)人(rén)工智能发展的(de)智能底座(zuò),是全(quán)球竞争最激烈的(de)研究(jiū)方向之一,包括(kuò)谷歌(gē)、亚马逊、百度(dù)、阿里、腾(téng)讯等众多头部(bù)企业都(dōu)在竞相(xiāng)发力。

不过训练大模型的确(què)价格不菲,以(yǐ)国盛证券发布的《ChatGPT需要多少算(suàn)力》报告(gào)估算,GPT-3训练一次的成本约为(wèi)140万美(měi)元。而对于一些(xiē)更大的(de)LLM(大型语言模型),训练成本则介于200万(wàn)美(měi)元(yuán)至1200万美元高价之间(jiān)。

以ChatGPT在2023年1月的独立访客(kè)平(píng)均数1300万计算,其对(duì)应芯片需求为(wèi)3万多(duō)片英伟达A100 GPU,初始投入成本(běn)约为8亿美(měi)元,每日仅电费(fèi)就(jiù)在5万美(měi)元左右。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控期,将(jiāng)洗(xǐ)牌科技行(xíng)业(yè)?_黑料正能量

此外不(bù)论(lùn)是ChatGPT还(hái)是AIGC,都离不开庞大算(suàn)力支持。在关注各类大(dà)模(mó)型的发展同时,更应该(gāi)关注算(suàn)力网络的建设(shè)。

算(suàn)力网络(luò)正驱动AI产业发展(zhǎn)进入史诗级加速进程,让(ràng)AIGC及通(tōng)用AI这一人(rén)工智能发(fā)展的终极(jí)目标离得更近。

因(yīn)为算(suàn)力可(kě)以(yǐ)对突破(pò)性技术创新(xīn)提供大力的支持。这方面,多模态大(dà)模(mó)型是(shì)典型。作为面向未(wèi)来强人工智能、通用人工智能的重要(yào)技术(shù)创(chuàng)新,多模态大模型已(yǐ)经在人工智能领域提出了很(hěn)多年,业(yè)界也有不少技术(shù)突破,但是(shì),多模态(tài)大模型进一步往下(xià)走,算力需求呈(chéng)几何式上升,一(yī)般的(d作出指示和做出指示区别在哪,作出指示还是做出e)算力(lì)基(jī)础设(shè)施很(hěn)快将难以胜任。

从图像、文字、语(yǔ)音单独(dú)一项的(de)训(xùn)练,到双模态(tài)、三模态的跃迁,让人(rén)工智(zhì)能可以灵活应对(duì)不(bù)同模态的转(zhuǎn)化(huà)、像人(rén)与世界交互一样自然,这方面,由算力网(wǎng)络来驱动将(jiāng)有明(míng)显优势。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗(xǐ)牌科技行业?_黑料正(zhèng)能量(liàng)

此外,还(hái)有很多(duō)需要爆发式增长的算力来支撑的技术创(chuàng)新,将在人(rén)工智能(néng)算力网络(luò)支(zhī)撑下快(kuài)速(sù)推进(jìn)。

AIGC已(yǐ)经露出(chū)曙光(guāng),期待在(zài)大模(mó)型和(hé)大算力的支(zhī)持(chí)下AIGC能持续颠覆内容生(shēng)产的(de)方式,将创(chuàng)造的边际成(chéng)本降(jiàng)低,让万(wàn)众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 作出指示和做出指示区别在哪,作出指示还是做出

评论

5+2=