橘子百科-橘子都知道橘子百科-橘子都知道

三维向量叉乘公式矩阵,三维向量叉乘公式行列式

三维向量叉乘公式矩阵,三维向量叉乘公式行列式 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人(rén)ChatGPT火爆(bào)以来,微(wēi)软公(gōng)司(sī)创始(shǐ)人比尔·盖(gài)茨已多次公开(kāi)谈论人(rén)工(gōng)智能话题。在(zài)最近的一次采(cǎi)访中(zhōng),他(tā)再(zài)次表示:“AI可能(néng)会让科(kē)技行业迎来一次剧烈(liè)的洗牌(pái)”。

这(zhè)个(gè)结论是他在(zài)当地(dì)时(shí)间(jiān)2月20日接受(shòu)《In Good Company》节目专访(fǎng)时提出的。

他预期,AI的发展(zhǎn)可能会威胁到谷(gǔ)歌的市(shì)占率,因为微软(ruǎn)在AI方面(miàn)的行动相当迅速。而最终(zhōng)科技巨头将把AI整合成用户的“全能助手”,包揽一切(qiè)应用,与人们(men)进行沟通(tōng)并提供建议,可(kě)以取(qǔ)代亚马(mǎ)逊、Siri或Outlook等(děng)应用。

大佬口(kǒu)中全(quán)能助手的到来可能尚(shàng)需(xū)时日,但(dàn)由ControlNet引(yǐn)发的又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的(de)话题(tí)热点(diǎn)包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控(kòng)期(qī),将洗牌科技行(xíng)业?_黑料正(zhèng)能(néng)量

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可(kě)控(kòng)靠近(jìn)

以AI绘画(huà)为代表的AIGC上一次爆火的时(shí)候,还是2022年8月,在美国科罗拉(lā)多(duō)州举办(bàn)的新兴数字艺术家竞(jìng)赛(sài)中,一幅名(míng)为《太空歌剧院》的作(zuò)品获奖。

随(suí)后各大厂商的AI绘画(huà)软件(jiàn)被(bèi)广大网友(yǒu)熟知(zhī)并体验(yàn),Stable Diffusion便是其(qí)中代(dài)表(biǎo)。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料(liào)正能量

用户们可以在应用(yòng)中输入一(yī)组关(guān)键词或者一张照(zhào)片(piàn),就能获得一幅AI创作的画作。

作(zuò)画的关键就是所输入的文本。同一(yī)组关键(jiàn)词也可以创作(zuò)出很多(duō)张风格不一样的(de)画作,这让创(chuàng)作的过(guò)程(chéng)就像开盲(máng)盒。

很多用户很喜欢这种不确定(dìng)的惊喜(xǐ),他们(men)会将生成的(de)美图当做头像。而另一部分喜(xǐ)欢翻看AI绘(huì)画(huà)的“翻车”作品。在社(shè)交(jiāo)媒体上,许多用户分享AI“翻车现(xiàn)场”,例(lì)如,一(yī)位网友(yǒu)的小狗照(zhào)片(piàn)被AI画成了“肌肉男(nán)”,还(hái)有网(wǎng)友的个人照(zhào)片被AI识别成了(le)建筑。

而如今随着ControlNet的出现与加持(chí),以往AI绘画的填写关键词(cí)游戏可能要(yào)被颠(diān)覆了。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期(qī),将洗牌科技行(xíng)业(yè)?_黑料正能量

ControlNet是一位正在斯坦福读博的中国人张吕(lǚ)敏创作的一(yī)种基于控制点的图像(xiàng)变形算(suàn)法,主要用于数字图像处(chù)理(lǐ)、计算机视觉和计算机图形学等(děng)领域。

其SD插件一经发布,在短短的两天(tiān)内便成为(wèi)了AI绘画领域最(zuì)新的热点。

在此之(zhī)前(qián),大(dà)家用了很(hěn)多方法想让AI生(shēng)成(chéng)的结(jié)果尽可能的(de)符合(hé)要求(qiú),但是都不(bù)尽如人意(yì),它的出现代表着AI生(shēng)成开始(shǐ)进入真正的(de)可控(kòng)时期。

因为ControlNet可以直接(jiē)提取画面(miàn)的构图,人物的姿势和画面的深度信息(xī)等。有了它的帮助,就不(bù)用频繁的用(yòng)提示词(cí)来碰运气,抽盲盒(hé)式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了“魔法(fǎ)”,不(bù)少博主(zhǔ)的作(zuò)品(pǐn)已经获(huò)得了大量的浏览(lǎn)量,“viggo”就是其中之一,他(tā)用朋友的照片直(zhí)接带她们走进动漫世(shì)界。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进(jìn)入可控(kòng)期(qī),将洗牌科技行业?_黑料正能(néng)量

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展找到(dào)对应的关键词;最后(hòu)用ControlNet插件绑(bǎ三维向量叉乘公式矩阵,三维向量叉乘公式行列式ng)定骨(gǔ)骼开(kāi)始换关(guān)键词试效果。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技(jì)行业?_黑料正(zhèng)能量

通过图片(piàn)就可以看(kàn)出来,效果十分惊艳(yàn)。

ChatGPT之后(hòu)又(yòu)一(yī)应用(yòng)杀疯了(le),AIGC或(huò)进入(rù)可控期,将洗牌科技行业(yè)?_黑料正能量(liàng)

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或(huò)进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正(zhèng)能量

更厉害的是,除了真实的照片,草图也(yě)可以(yǐ)加上“魔法”,知乎大牛(niú)“DevPoint”和(hé)“逗砂”介(jiè)绍到ControlNet还能实现线稿转全(quán)彩(cǎi)图。大神张吕敏其本尊也(yě)亲(qīn)自回应。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科技行(xíng)业(yè)?_黑料正能量

不得不说当下AIGC已经变得(dé)越来(lái)越(yuè)强大,甚至输出的作品都已经能以假(jiǎ)乱真了。

02

难辨虚实,AIGC技(jì)术力爆发

警(jǐng)惕安全问题

近日,“苏州(zhōu)金鸡湖有游艇party”的消息火遍网络(luò),而经过警方辟(pì)谣(yáo)这所谓的“party”可能是全国第一起AI绘图(tú)诈骗。

由于这个活(huó)动里(lǐ)面给出的(de)美女照片都(dōu)是(shì)AI制作的真人照片绘图,因为太逼真(zhēn),被大(dà)家(jiā)当成(chéng)真事(shì)传播了(le)

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

不过(guò)仔细(xì)观察可以发(fā)现,活(huó)动发起(qǐ)者提供的(de)照(zhào)片中有个很(hěn)大的漏洞可以发现并非真人,而(ér)是AI绘图(tú),那便(biàn)是图片中(zhōng)女性的手指(zhǐ)部分(fēn)有的存在异常。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料(liào)正(zhèng)能量

有(yǒu)行(xíng)业人事表(biǎo)示(shì):“现(xiàn)在因为手(shǒu)指部(bù)分的绘(huì)画算法比(bǐ)较复杂(zá),AI还不(bù)太会画人的手(shǒu),但最新看到(dào)的图片已经有越(yuè)来越完美的AI模(mó)型出(chū)现,以后可(kě)能就完全没(méi)有漏洞了。

类似的AI作图(tú)诈骗在国外(wài)也已有发生。据英国广播公(gōng)司报道,土耳其地(dì)震期间,有Tiktok用户使(shǐ)用AI合成了儿童受灾的假照片(piàn)发布到(dào)网(wǎng)络,以此诱骗善良的人打赏“捐助”从而实施诈(zhà)骗。

目(mù)前随着(zhe)技术发展,AIGC已(yǐ)经能做出真人照片般的绘图效果,如(rú)果这(zhè)样的图片(piàn)被用来诈骗,将非常可怕。

此(cǐ)外AIGC还引发了很多担忧,一方面,批判者认为AI在“学习”了大量前人的(de)作(zuò)品(pǐn)之后,其创作没有(yǒu)任(rèn)何情绪和(hé)灵魂,难以和人类的(de)艺术创作相提并论(lùn)。

另一方面,AIGC背后的版权(quán)、目(mù)前都并没有得(dé)到有效的解决,还有(yǒu)AIGC会不会(huì)代替人类“至高无(wú)上”的(de)创意。

马斯克也强(qiáng)调(diào),人工智能(néng)的安全问题(tí)需要得(dé)到重视(shì),太晚就来不及了(le)。

03

AIGC下一站除了视(shì)频,还有远方

技术(shù)都是有两面性的,潜在的危害并(bìng)不能掩盖其光辉的贡献。现在看(kàn)来,人(rén)工智能(néng)技术(shù)将是第四次(cì)工(gōng)业革命(mìng)的核心驱(qū)动(dòng)力量,将创造新(xīn)的增长奇(qí)迹。

过去一年,人工智能在(zài)技术和商业层面都(dōu)有了巨大进展,AI绘画就是人工智能技术发(fā)生方向(xiàng)性改变的一(yī)个代(dài)表。其下一站(zhàn)或许就是视(shì)频。

此前,Meta和谷(gǔ)歌先后(hòu)发(fā)布了几条引爆科技(jì)圈的(de)短(duǎn)视频。这些视频引发关注并(bìng)非内容做得多优秀,反而(ér)都非常简单,比如一匹正(zhèng)在喝水(shuǐ)的(de)马,一只画画的玩具(jù)熊,或(huò)者(zhě)一(yī)段骑摩托车的第一视角录像(xiàng),随便一个有手机的人(rén)都可(kě)以随手(shǒu)录下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技(jì)行业(yè)?_黑料(liào)正能量(liàng)

但这(zhè)些短视频的创作方式非常(cháng)简单,创作者仅仅需要向AI输入一段话,甚至只(zhǐ)是说一(yī)下要求,AI就可以根据需要生(shēng)成一(yī)段视频。

谷歌发布的两个(gè)AI生成视频分别(bié)来自于(yú)Imagen Video和Phenaki,前者(zhě)主要突出的是高清(qīng),与Meta的Make-A-Video没有太多的(de)差别。

在(zài)Make-A-Video公布了(le)AI生成的视频后,AI圈就已经玩(wán)了一波(bō)梗,一(yī)个能够做出更高清视(shì)频的AI还不足以(yǐ)在短时间内戳(chuō)中(zhōng)兴奋点。

Phenaki更加令人震(zhèn)惊的地(dì)方在于,它可以制作出超过2分钟的连贯的也有确(què)切(qiè)内容的视(shì)频,这才是真正(zhèng)让人们感到(dào)惊喜(xǐ)的地方。因为(wèi)无(wú)论AI生成的视频多么高清,也(yě)只能是为内容生(shēng)产者提供一个(gè)灵(líng)感(gǎn),一个素材,一个过场动画(huà)。

不过能(néng)够(gòu)制作出有(yǒu)具(jù)体(tǐ)剧情内(nèi)容的(de)视频就意味着,一些视频(pín)创作(zuò)由(yóu)AI代替人工(gōng)完成已经初步有(yǒu)了可能。

当(dāng)下AI的发展速度已(yǐ)经超过大部分(fēn)人的想象(xiàng)。内容(róng)产业的本质是供给创(chuàng)造需求,AIGC作为全新的内容生产方(fāng)式,可以为内(nèi)容(róng)产业(yè)带来更新的(de)内容风格、更快(kuài)的(de)生产速度(dù),更低的生产成本,这无(wú)疑会(huì)驱动内容产业的大爆发。

除了AI绘图、视(shì)频,AIGC技术还能应用于音乐、代码、机器人动作等多种内容形式的生成。不难(nán)发现该项技(jì)术不(bù)仅在游戏等(děng)行业能得(dé)到(dào)有效应用(yòng),对于(yú)下一代互联网各种元(yuán)素的构建亦有关键(jiàn)意义。

从(cóng)商(shāng)业(yè)化的角度(dù)来看(kàn),文化娱(yú)乐、教育、传媒等诸多领(lǐng)域,本身就对基于AI的可(kě)视化内(nèi)容有强烈需求。

因(yīn)此,AI绘画(huà)及视频或不(bù)是结果,而只(zhǐ)是AI进程(chéng)中的(de)一块重要(yào)拼图,有望在技术更新的加持(chí)下实现更大的应用价值(zhí)。

AI从理(lǐ)解(jiě)内(nèi)容,走向了可以生成内容,甚至能够创造出独立价值(zhí)和独立(lì)视角的内容。AIGC的再次出圈,更(gèng)代表着未来的先进生产力即将到来。

ChatGPT之后又(yòu)一应用杀疯(fēng)了(le),AIGC或进入可控(kòng)期,将洗牌(pái)科技行业?_黑料正能量

04

紧抓大(dà)模(mó)型与算力(lì),牢固AIGC底座

从技术的发展也可以看出,在(zài)语言大(dà)模型、图像(xiàng)大模型之后,多模(mó)态大模型(xíng)已经成为了新(xīn)的趋势。

大模型被誉为当(dāng)前人工智能发(fā)展(zhǎn)的智能底(dǐ)座,是全球竞争最(zuì)激烈的研究方向(xiàng)之一,包(bāo)括谷歌、亚马逊、百度、阿里、腾讯等(děng)众多头部企业(yè)都在竞相发力。

不过训练大模型的确(què)价(jià)格不(bù)菲,以国盛证券(quàn)发(fā)布的《ChatGPT需要多(duō)少算(suàn)力》报(bào)告(gào)估算(suàn),GPT-3训(xùn)练(liàn)一次的成(chéng)本约为(wèi)140万美元。而(ér)对于(yú)一些(xiē)更大的LLM(大型语言模型),训练成本则介(jiè)于200万美(měi)元(yuán)至(zhì)1200万美元高价之间。

以ChatGPT在(zài)2023年(nián)1月(yuè)的(de)独立访客平(píng)均数(shù)1300万(wàn)计算,其对应(yīng)芯片需求为3万多(duō)片英伟达A100 GPU,初始投入(rù)成本约为8亿美元,每(měi)日仅(jǐn)电费(fèi)就(jiù)在5万(wàn)美元(yuán)左右。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行(xíng)业?_黑料正能量

此外不论(lùn)是ChatGPT还是AIGC,都离不(bù)开庞大算(suàn)力(lì)支(zhī)持。在关(guān)注各类大模型的发展同时,更应该关(guān)注算(suàn)力网络的建设。

算力网(wǎng)络正(zhèng)驱动AI产(chǎn)业发(fā)展进入(rù)史诗级加速进程,让AIGC及通(tōng)用AI这一人工(gōng)智能发展的终极目(mù)标离得更(gèng)近。

因(yīn)为算力(lì)可(kě)以对(duì)突破性技(jì)术创新(xīn)提供(gōng)大(dà三维向量叉乘公式矩阵,三维向量叉乘公式行列式)力的支持。这方面,多模态大模型是典型。作为(wèi)面(miàn)向未来强人工智(zhì)能、通用人(rén)工智能的重要技术创新,多模态大模(mó)型已经在人工智能领域提出了很多年,业(yè)界也有不少(shǎo)技术(shù)突(tū)破(pò),但是,多模态(tài)大(dà)模型进一步往(wǎng)下走,算力需(xū)求呈几(jǐ)何式上升,一般的算力基础设施很快将难以胜任。

从图(tú)像、文字、语(yǔ)音单独(dú)一项的训练,到双模(mó)态、三模态的(de)跃迁,让人工智(zhì)能(néng)可以灵活应对不(bù)同(tóng)模态的转化、像人与世界交(jiāo)互一样自然,这方面,由算力网络来驱动将有明显优势(shì)。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗(xǐ)牌科技行业?_黑料正(zhèng)能(néng)量

此外,还(hái)有很多需(xū)要爆发式增(zēng)长的(de)算力来(lái)支撑的技(jì)术(shù)创新(xīn),将在人(rén)工智能算(suàn)力网络支撑下快速(sù)推进。

AIGC已(yǐ)经露出曙光,期待在大模型和大算力的支持下AIGC能持(chí)续颠覆(fù)内容(róng)生产的方式(shì),将创造的边际成本降低(dī),让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 三维向量叉乘公式矩阵,三维向量叉乘公式行列式

评论

5+2=