橘子百科-橘子都知道橘子百科-橘子都知道

之字是什么结构的字,近字是什么结构

之字是什么结构的字,近字是什么结构 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火爆(bào)以来,微软(ruǎn)公司创(chuàng)始人比尔·盖茨已(yǐ)多次公(gōng)开谈论人(rén)工智能话题。在最近的一(yī)次采访(fǎng)中,他再次表示:“AI可(kě)能会让科技行(xíng)业迎来一次剧烈(liè)的洗牌”。

这个结论是他在(zài)当(dāng)地(dì)时间2月20日接受(shòu)《In Good Company》节(jié)目专访时提出的。

他预期(qī),AI的(de)发(fā)展可能会威胁(xié)到谷歌的市(shì)占率,因为微软(ruǎn)在AI方面的行动(dòng)相当迅速。而最终科技巨头将把AI整合成用户的“全能助手”,包揽(lǎn)一切应用,与(yǔ)人(rén)们进行沟(gōu)通并提供(gōng)建议,可以取(qǔ)代亚马逊、Siri或Outlook等应(yīng)用(yòng)。

大佬口中全能(néng)助手的到(dào)来可能尚需时(shí)日,但由ControlNet引(yǐn)发的又一次AI绘(huì)画浪潮,让AIGC在(zài)ChatGPT的话题热点包围中杀出(chū)重围。

ChatGPT之后(hòu)又(yòu)一应用杀疯了(le),AIGC或(huò)进入可控(kòng)期,将洗牌科技行业?_黑(hēi)料(liào)正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠(kào)近

以AI绘画(huà)为(wèi)代(dài)表的AIGC上一(yī)次(cì)爆火的时候,还是2022年(nián)8月(yuè),在(zài)美(měi)国科(kē)罗拉多州举办的新(xīn)兴数(shù)字艺术家竞赛中,一(yī)幅(fú)名为《太(tài)空歌剧院(yuàn)》的作品获奖。

随后各大(dà)厂商(shāng)的AI绘画软件被广大网友熟知并体(tǐ)验,Stable Diffusion便是其(qí)中(zhōng)代表。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能量

用户(hù)们可以(yǐ)在应(yīng)用中(zhōng)输入(rù)一组关键词或者一张照片,就能获(huò)得一幅AI创作的画作。

作(zuò)画的关键就是所输入的文本。同一(yī)组(zǔ)关键(jiàn)词也可以创(chuàng)作出很多张风格不一样的画作,这让创(chuàng)作的过程就像(xiàng)开盲(máng)盒。

很多用户很(hěn)喜(xǐ)欢这种不确定的惊喜,他们会(huì)将生成的(de)美图当做头像。而(ér)另一(yī)部分喜欢翻(fān)看AI绘画(huà)的(de)“翻车”作品。在社(shè)交媒体上,许多用户分享(xiǎng)AI“翻(fān)车现场(chǎng)”,例如,一位(wèi)网友的小狗照片被AI画成(chéng)了“肌肉男”,还(hái)有网友的个人照片被AI识(shí)别成了建筑。

而如今随着(zhe)ControlNet的出现与加(jiā)持,以往AI绘画的填写关键(jiàn)词游戏可(kě)能要被颠覆了。

之字是什么结构的字,近字是什么结构t="ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌科(kē)技行业?_黑料正能量" decoding="async" src="https://mmbiz.heiliaofuli.com/wp-content/uploads/2023/03/19d7ab2c0056bd4.jpeg?imageMogr2/thumbnail/2160x0/format/webp/quality/80" data-ratio="1.12109375" data-s="300,640" data-type="jpeg" data-w="1024">

ControlNet是一位正在斯坦福(fú)读博的中国人(rén)张吕(lǚ)敏创作(zuò)的(de)一种基于(yú)控制点的图像变形算法,主(zhǔ)要用于数字图像处理、计算机视觉和计(jì)算(suàn)机(jī)图形学等领域。

其SD插(chā)件一经发(fā)布,在(zài)短短的(de)两天内便(biàn)成(chéng)为了AI绘画(huà)领域最新(xīn)的热点。

在此(cǐ)之前,大家用(yòng)了很多方法想让AI生成的结果尽可能的符合要求(qiú),但是都不尽如人意,它的出现代(dài)表着AI生成开始进入真(zhēn)正的可控时期。

因(yīn)为ControlNet可(kě)以(yǐ)直接提取(qǔ)画面(miàn)的构图(tú),人物(wù)的姿势和(hé)画面的深度(dù)信息等(děng)。有了它的帮(bāng)助,就(jiù)不用频繁的用提示词来碰运气(qì),抽盲(máng)盒式的(de)创作了。

通俗的说(shuō)ControlNet相当于给AI绘画加了“魔法”,不少博(bó)主的作品(pǐn)已经(jīng)获(huò)得了(le)大量的浏览(lǎn)量,“viggo”就(jiù)是(shì)其中之一(yī),他用朋友的照片直(zhí)接带她们走进动漫世界。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行(xíng)业?_黑(hēi)料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找到(dào)对应的关键词(cí);最后用ControlNet插(chā)件(jiàn)绑定骨(gǔ)骼开始换关键词(cí)试效果(guǒ)。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进(jìn)入可控(kòng)期,将洗(xǐ)牌科技(jì)行业?_黑料正能(néng)量

通过(guò)图(tú)片就(jiù)可以看出来,效(xiào)果十(shí)分惊艳。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正能量

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗(xǐ)牌科技行(xíng)业?_黑料(liào)正能量

更厉害的是,除了真(zhēn)实的照片,草图也(yě)可以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转全彩(cǎi)图。大神张(zhāng)吕敏其本尊也亲(qīn)自(zì)回应(yīng)。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

不得不说当下AIGC已经变得越来越(yuè)强大(dà),甚至(zhì)输出的作品都已经能以(yǐ)假乱真了。

02

难辨(biàn)虚实,AIGC技术力爆发

警(jǐng)惕安全问题(tí)

近(jìn)日(rì),“苏州(zhōu)金(jīn)鸡湖有游艇(tǐng)party”的(de)消息(xī)火遍网络(luò),而经过(guò)警方辟(pì)谣(yáo)这所谓的“party”可(kě)能是全(quán)国第一(yī)起AI绘(huì)图(tú)诈骗。

由于这(zhè)个(gè)活动里面给(gěi)出的美女照(zhào)片都(dōu)是AI制作的真人照片绘(huì)图,因为太(tài)逼真(zhēn),被大家当成真事传播了

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科(kē)技行业?_黑料(liào)正能量

不过(guò)仔细观察可以发现,活动发(fā)起者提供(gōng)的照片中有个(gè)很大的漏洞可以发现并非(fēi)真人,而(ér)是(shì)AI绘图,那便是图片(piàn)中女性的手指部分有的存在异常。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正能量

有行业人事表示:“现在因为手(shǒu)指(zhǐ)部分的绘画算法比较(jiào)复(fù)杂(zá),AI还不太会画人的(de)手,但最新看到的图片已经有(yǒu)越来越完(wán)美的AI模型(xíng)出现,以后可(kě)能(néng)就完全没有漏洞(dòng)了(le)。

类似的AI作(zuò)图诈骗(piàn)在国外也已有发生。据(jù)英国(guó)广播(bō)公(gōng)司报道,土耳其地震期间,有Tiktok用户使用AI合成了儿童(tóng)受(shòu)灾的假照(zhào)片发布到网络(luò),以此诱骗(piàn)善良的人打赏“捐(juān)助”从而实施诈(zhà)骗。

目前(qián)随(suí)着技术发展,AIGC已经能(néng)做出真人(rén)照片般的(de)绘图效果,如果这样的图片被(bèi)用来诈骗,将非常可怕。

此外AIGC还(hái)引发了很多担(dān)忧,一(yī)方面(miàn),批判(pàn)者认为AI在“学习”了大量前人的作品之后,其(qí)创作(zuò)没有(yǒu)任何情(qíng)绪和灵魂,难以和(hé)人类的(de)艺术(shù)创作相提并论。

另一方面,AIGC背后的(de)版权、目前(qián)都并没有得到有效的解决,还有AIGC会(huì)不(bù)会代替人类“至高无上”的创意。

马斯克也强调,人工智(zhì)能(néng)的安全问题需要得到重视(shì),太(tài)晚就来不及了。

03

AIGC下(xià)一站除了视频,还(hái)有(yǒu)远方

技术都是(shì)有两(liǎng)面性(xìng)的,潜在(zài)的危害并不能(néng)掩(yǎn)盖(gài)其(qí)光辉的(de)贡献。现在(zài)看来,人工智能技术将是第四(sì)次工业革命的核心驱动力量,将创造新的增(zēng)长奇迹。

过(guò)去一年,人工智能在技术和商业层面都有了巨大进(jìn)展(zhǎn),AI绘画就是人工智能技术发生方向性改变的一个(gè)代表。其(qí)下(xià)一站(zhàn)或(huò)许就是视频。

此前,Meta和谷(gǔ)歌先后发(fā)布了几(jǐ)条引(yǐn)爆科技圈的短视频。这些视频引发关注并(bìng)非内容(róng)做得多优秀,反而(ér)都(dōu)非常简单,比(bǐ)如一匹正在(zài)喝水的马(mǎ),一只画(huà)画的玩具熊,或(huò)者(zhě)一段(duàn)骑摩托车(chē)的第一视角录(lù)像,随便一(yī)个有手机(jī)的人都(dōu)可(kě)以(yǐ)随手录(lù)下一(yī)段。之字是什么结构的字,近字是什么结构>

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

但这些(xiē)短(duǎn)视频的创作方式非常简单(dān),创作者(zhě)仅仅(jǐn)需要(yào)向AI输入一段话,甚至只是说一下要求,AI就可以根据需要生成一段视频。

谷歌(gē)发布的(de)两个AI生成视频分别来自于Imagen Video和Phenaki,前(qián)者主要(yào)突出(chū)的是(shì)高清,与Meta的(de)Make-A-Video没有(yǒu)太多的差别。

在Make-A-Video公布(bù)了AI生成的视频(pín)后(hòu),AI圈就已(yǐ)经(jīng)玩了(le)一波梗(gěng),一个能(néng)够做出更高清视频的AI还不足以在短(duǎn)时间内戳中兴(xīng)奋点。

Phenaki更加令人(rén)震(zhèn)惊(jīng)的地方(fāng)在于(yú),它可以(yǐ)制作出超过2分(fēn)钟的连贯的也有确切内(nèi)容的视频,这(zhè)才(cái)是真正(zhèng)让(ràng)人(rén)们(men)感到惊喜的(de)地方。因为无论AI生成的视频多么高(gāo)清,也只能是为内容生产(chǎn)者提供一个灵感,一个素材,一个过场动画。

不过能够制作出有具体剧情内容的视(shì)频就意味(wèi)着,一些视频创作(zuò)由AI代替人(rén)工完(wán)成已(yǐ)经初步(bù)有了可能。

当(dāng)下AI的发展速(sù)度已经超过大部分(fēn)人的想(xiǎng)象(xiàng)。内(nèi)容产业的本质是供给创造需求(qiú),AIGC作(zuò)为全新(xīn)的(de)内容生产(chǎn)方式(shì),可以(yǐ)为内容产业带来更新的内容(róng)风格、更快的生产速度,更低(dī)的生产(chǎn)成本,这无(wú)疑会驱动内容产业的大爆(bào)发。

除了AI绘图(tú)、视频,AIGC技术还能(néng)应用于音乐、代码、机器(qì)人(rén)动(dòng)作等多(duō)种内容形式的生成。不难发现该项技术不仅在游戏等行业(yè)能得到有效应用,对于下一代(dài)互联网各种元素的(de)构建(jiàn)亦有(yǒu)关键意义。

从商(shāng)业化的角度来(lái)看,文化娱乐、教育、传媒等诸(zhū)多领域,本身就对基于AI的可视化(huà)内容有强烈需求。

因此,AI绘画(huà)及视频(pín)或不是结果,而只是AI进程中的一(yī)块(kuài)重(zhòng)要(yào)拼图,有望在技术更新的(de)加持下实(shí)现更大的应用(yòng)价值。

AI从理(lǐ)解内容,走(zǒu)向了(le)可以生成内容,甚至能够创造(zào)出独(dú)立价值(zhí)和独(dú)立(lì)视角的(de)内容。AIGC的(de)再次出圈(quān),更代表着未来的先(xiān)进生产力即(jí)将到来。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可(kě)控(kòng)期,将(jiāng)洗牌(pái)科技行业?_黑料正能量

04

紧抓大(dà)模型与(yǔ)算力,牢固AIGC底座(zuò)

从技术的发(fā)展(zhǎn)也(yě)可以看出,在语言大模型、图像大(dà)模型之后,多模态大模型已经成为了新的趋势。

大模型被誉为当前人工智能(néng)发展的智能底座(zuò),是(shì)全球竞(jìng)争最(zuì)激烈的研究方(fāng)向之一,包括谷(gǔ)歌、亚(yà)马逊、百(bǎi)度、阿(ā)里、腾讯等众多(duō)头部企业都在(zài)竞相发(fā)力。

不过训练大模型的确(què)价(jià)格不菲,以国盛证券发布的《ChatGPT需要多少算力》报告估算,GPT-3训练一次的(de)成本约为(wèi)140万(wàn)美元。而(ér)对于一些更大(dà)的LLM(大型语(yǔ)言模型),训练成本(běn)则介(jiè)于200万(wàn)美元至1200万美(měi)元(yuán)高价(jià)之间。

以(yǐ)ChatGPT在2023年1月的独(dú)立访客平均数1300万计算(suàn),其对应芯片需求为3万多片(piàn)英伟(wěi)达A100 GPU,初始(shǐ)投入(rù)成本约为8亿美(měi)元,每日仅电费就在5万美元左右。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进(jìn)入(rù)可(kě)控(kòng)期,将洗牌科技行业?_黑料正能(néng)量

此外不(bù)论是ChatGPT还是AIGC,都离不(bù)开庞大算力支持。在关注各(gè)类大(dà)模型的发展同(tóng)时(shí),更(gèng)应该(gāi)关(guān)注算力网络(luò)的建设。

算力网络正驱(qū)动(dòng)AI产业发展进(jìn)入(rù)史诗级加速进程,让AIGC及通用AI这一人工智能发(fā)展的终极目标离得更(gèng)近。

因(yīn)为(wèi)算力(lì)可以对突破性技(jì)术创新提供大力的支持。这方面,多模态(tài)大模型是典型。作为面(miàn)向未来强人工(gōng)智能、通用人工智能的重(zhòng)要技术创新,多模态大模型已(yǐ)经在人工(gōng)智能领域(yù)提出了很多年,业界也有(yǒu)不少技术突破,但是(shì),多模(mó)态(tài)大(dà)模型进一步往下走,算力(lì)需求呈几何式上升,一(yī)般的(de)算力(lì)基(jī)础设施很快将难(nán)以胜(shèng)任(rèn)。

从图像、文(wén)字、语(yǔ)音单独(dú)一项的(de)训练,到双模态、三模态的跃(yuè)迁,让(ràng)人工智能可以灵活应对不(bù)同模态的(de)转化、像人与(yǔ)世界交互一样自然(rán),这(zhè)方面,由算(suàn)力(lì)网络来驱动将有明显优(yōu)势。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控(kòng)期(qī),将洗牌科技行业?_黑料正能量

此外,还有(yǒu)很多(duō)需要(yào)爆发式(shì)增长的算力来支(zhī)撑的技术(shù)创(chuàng)新,将在人工智能算力网络支(zhī)撑(chēng)下快速推进(jìn)。

AIGC已(yǐ)经露出曙(shǔ)光(guāng),期待在大(dà)模型和(hé)大算力的支持下AIGC能持续(xù)颠覆内容生产的方式,将创造的边际成(chéng)本降低(dī),让万众(zhòng)受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 之字是什么结构的字,近字是什么结构

评论

5+2=