橘子百科-橘子都知道橘子百科-橘子都知道

微端是什么意思 手机端玩的叫微端吗

微端是什么意思 手机端玩的叫微端吗 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人(rén)ChatGPT火爆(bào)以来,微(wēi)软公司创始(shǐ)人比尔·盖茨已(yǐ)多次公(gōng)开谈论人工智(zhì)能话题。在最近的一次采(cǎi)访中,他再(zài)次表示(shì):“AI可能会让科技行业(yè)迎来一次剧烈的(de)洗牌(pái)”。

这个结(jié)论是他在(zài)当地时间2月20日接受《In Good Company》节目(mù)专访时提出的。

他预期,AI的发展(zhǎn)可能会(huì)威胁到谷(gǔ)歌的市占率,因(yīn)为微软在(zài)AI方(fāng)面的行动相当迅速。而最终科技巨头将把AI整合成(chéng)用户的“全(quán)能助(zhù)手”,包揽一(yī)切应用,与(yǔ)人们进行沟(gōu)通并提供建议,可(kě)以(yǐ)取(qǔ)代亚马逊、Siri或Outlook等应用。

大佬(lǎo)口中全能助手的到来可能尚需时日,但由ControlNet引发的又一次AI绘画浪(làng)潮(cháo),让AIGC在ChatGPT的话题热点包围中杀(shā)出重围。

ChatGPT之后又一(yī)应用杀疯(fēng)了(le),AIGC或进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料(liào)正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控(kòng)靠(kào)近

以AI绘画为代表的AIGC上一次爆(bào)火(huǒ)的时候(hòu),还(hái)是2022年8月,在美国科罗拉多(duō)州(zhōu)举办的(de)新兴(xīng)数字(zì)艺(yì)术家竞赛中,一幅名(míng)为《太空歌剧院(yuàn)》的(de)作品(pǐn)获奖。

随后各大(dà)厂商的AI绘画软件被广(guǎng)大网友熟知并体验,Stable Diffusion便(biàn)是其中代(dài)表(biǎo)。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或(huò)进入可(kě)控期,将洗牌科技行业?_黑料(liào)正能量

用户们可以(yǐ)在(zài)应用(yòng)中输(shū)入一组关键词(cí)或者一张照片,就能(néng)获得一幅AI创作的画作。

作画(huà)的关键(jiàn)就是所输入的文(wén)本。同一组关键词也(yě)可以创作(zuò)出(chū)很(hěn)多张(zhāng)风格不(bù)一样的画作,这让创作的(de)过程(chéng)就像开盲(máng)盒(hé)。

很(hěn)多用户很喜欢这种不确定的(de)惊喜,他们(men)会将生成的(de)美(měi)图当做头像。而另(lìng)一部分喜欢翻看AI绘画的“翻车”作品。在(zài)社(shè)交媒(méi)体(tǐ)上,许多用户分享AI“翻车(chē)现场”,例如(rú),一位网(wǎng)友的(de)小狗照片被AI画成了“肌肉男”,还(hái)有网友的个人照(zhào)片被(bèi)AI识别(bié)成了建筑。

而如今随(suí)着(zhe)ControlNet的出现与(yǔ)加持,以往AI绘画的(de)填写关键词游(yóu)戏可能要被(bèi)颠覆(fù)了。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可控(kòng)期,将洗牌科技行业?_黑料(liào)正能(néng)量

ControlNet是一位正在斯(sī)坦福读博的中国人张吕敏创作(zuò)的一种(zhǒng)基于控(kòng)制(zhì)点(diǎn)的图(tú)像变形算法(fǎ),主(zhǔ)要用于数字图像处理、计算(suàn)机视(shì)觉和计算机图(tú)形学等领域。

其SD插件一经发布(bù),在短短的两(liǎng)天内便成为(wèi)了AI绘画领域(yù)最新(xīn)的热点。

在此之前,大(dà)家用了很多方(fāng)法想让AI生成(chéng)的结果(guǒ)尽可能的符(fú)合要求,但是都不尽如人意(yì),它的出现代表着(zhe)AI生成开始进入真正(zhèng)的(de)可控时期(qī)。

因为ControlNet可以直接提取(qǔ)画面(miàn)的(de)构图,人物的(de)姿(zī)势和(hé)画面(miàn)的深度信息等。有了它的(de)帮助,就不用频繁的用提示词(cí)来碰运气,抽盲盒式的创作了。

通俗的(de)说ControlNet相当于(yú)给AI绘画加了“魔法(fǎ)”,不少博主的作品已经获得(dé)了大量(liàng)的浏览量,“viggo”就是其中(zhōng)之一,他(tā)用朋友(yǒu)的照片直接带她(tā)们走进(jìn)动漫世界(jiè)。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或(huò<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>微端是什么意思 手机端玩的叫微端吗</span></span>)进(jìn)入可控期(qī),将洗(xǐ)牌科技行业(yè)?_黑(hēi)料正(zhèng)能(néng)量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓(tuò)展找(zhǎo)到(dào)对应的关键词;最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试(shì)效果。

ChatGPT之后(hòu)又一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能量(liàng)

通过图(tú)片就可以看出来,效(xiào)果十分惊艳。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技行(xíng)业(yè)?_黑(hēi)料正能量(liàng)

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业(yè)?_黑(hēi)料正能量

更厉(lì)害的是,除了真实的照片,草图也可以加(jiā)上(shàng)“魔法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍到ControlNet还能实(shí)现(xiàn)线稿转全彩图。大神张吕敏其本尊也(yě)亲自回应。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技(jì)行(xíng)业?_黑料正能量(liàng)

不得不(bù)说当(dāng)下AIGC已经变得越来越强大(dà),甚至输(shū)出的作品(pǐn)都已经能以(yǐ)假乱真(zhēn)了。

02

难辨虚实,AIGC技术(shù)力(lì)爆(bào)发

警惕安全问(wèn)题

近日,“苏州金鸡湖有游艇party”的消息(xī)火遍网络,而经过(guò)警方辟谣这所谓的“party”可能是全国(guó)第一起AI绘图(tú)诈骗(piàn)。

由(yóu)于这个活(huó)动里面给出的美女照片都是(shì)AI制作的(de)真人照片绘(huì)图(tú),因为太逼真,被(bèi)大(dà)家当成真事传播(bō)了

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期(qī),将洗牌科技行业?_黑料正(zhèng)能量

不过仔细(xì)观察(chá)可以发现,活动发起者提供的照片中(zhōng)有(yǒu)个很大的漏洞可以发现(xiàn)并非真(zhēn)人,而是AI绘(huì)图,那便(biàn)是图片中女性的手指部(bù)分(fēn)有的存在异常。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能量

有行业人事表示(shì):“现在因为手指部分的(de)绘画算(suàn)法(fǎ)比较复杂,AI还不太会画人(rén)的(de)手,但(dàn)最新看到(dào)的图片已经有越来越完美的AI模型出(chū)现(xiàn),以后可能(néng)就完(wán)全没有漏洞了。

类似的(de)AI作图诈骗在国外也已有发生。据英国(guó)广播公司报道(dào),土耳其地震期(qī)间,有Tiktok用户使用(yòng)AI合成了儿童受灾的假照片发布到网络,以此诱骗善良的人打赏“捐助(zhù)”从而实(shí)施诈骗(piàn)。

目(mù)前随着技(jì)术(shù)发展,AIGC已(yǐ)经能做出(chū)真人照片般(bān)的绘图效果,如果(guǒ)这(zhè)样的(de)图片被(bèi)用(yòng)来(lái)诈骗,将非常(cháng)可怕(pà)。

此外AIGC还引发(fā)了很(hěn)多担忧,一(yī)方面,批判者认为AI在“学习”了大(dà)量前人的作品之后(hòu),其创作没有任(rèn)何情绪和灵魂(hún),难以和人类的艺术创作(zuò)相提(tí)并论。

另一方面,AIGC背后的版权、目前都(dōu)并没有得到有效的解决,还(hái)有AIGC会不会代替(tì)人类“至高无上(shàng)”的创意。

马斯克也强调(diào),人工智能的安全问题需(xū)要得到重视(shì),太晚就来不及了。

03

AIGC下一(yī)站(zhàn)除了视(shì)频,还有远方

技术都是有两面性的,潜在的危害(hài)并不能掩盖其光辉的贡(gòng)献。现在看来,人工智(zhì)能技(jì)术将(jiāng)是第四次工业(yè)革命(mìng)的(de)核心驱(qū)动(dòng)力量,将创造新的增长奇迹(jì)。

过(guò)去一年,人工智能在(zài)技术和商业层面(miàn)都有了巨大(dà)进展,AI绘画就是(shì)人工(gōng)智能技术发生方向性改(gǎi)变的一个(gè)代表。其(qí)下(xià)一站或许就是视频。

此(cǐ)前,Meta和(hé)谷歌先后(hòu)发布了(le)几条引爆科技圈的短视频。这些视(shì)频引(yǐn)发关注并非内容做得多(duō)优秀(xiù),反而都非常(cháng)简(jiǎn)单(dān),比如一匹正在喝水的马,一只画(h微端是什么意思 手机端玩的叫微端吗uà)画(huà)的玩具(jù)熊,或者(zhě)一段(duàn)骑摩托(tuō)车(chē)的第一视角(jiǎo)录像,随便一个(gè)有手机的人都可以随手录下一段。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或(huò)进入可(kě)控期(qī),将洗牌(pái)科技行业?_黑料正能量(liàng)

但这些短视频的创作方式非常(cháng)简单,创作者仅仅需要(yào)向AI输入一(yī)段话,甚至只是说一(yī)下要求,AI就可(kě)以(yǐ)根据需(xū)要生(shēng)成一段视频(pín)。

谷(gǔ)歌发布的两个AI生成视频分别来自于Imagen Video和Phenaki,前者主(zhǔ)要突出的是高(gāo)清,与(yǔ)Meta的Make-A-Video没有太多的差别。

在(zài)Make-A-Video公布了AI生成的(de)视频后(hòu),AI圈就已经玩了一波梗,一个能够做出更高清视(shì)频的AI还不足以在短时间内戳中(zhōng)兴奋点。

Phenaki更(gèng)加令人震惊(jīng)的(de)地(dì)方在(zài)于,它可以制作出(chū)超过2分钟的连贯的也有确切内容(róng)的(de)视频,这才是真(zhēn)正(zhèng)让人们感到惊喜的地方。因为(wèi)无论(lùn)AI生成(chéng)的视频多么(me)高清,也只能(néng)是(shì)为内容生产者提供一个灵感,一个素(sù)材,一个过场动画。

不过能(néng)够(gòu)制作(zuò)出有具(jù)体剧情内容的(de)视频就意味着(zhe),一(yī)些视(shì)频创作由(yóu)AI代替人工完成(chéng)已经初步有了可能。

当下AI的发(fā)展(zhǎn)速度(dù)已经超过大部分人的想(xiǎng)象。内容产业的(de)本质是供(gōng)给创(chuàng)造需求(qiú),AIGC作为全新(xīn)的内容生产方(fāng)式,可以为内容产业带来更新的内容风格、更快的生产速度,更低的生产成本,这(zhè)无疑会驱动内容产(chǎn)业的(de)大爆(bào)发。

除(chú)了(le)AI绘(huì)图、视频,AIGC技术(shù)还能(néng)应用于音乐(lè)、代码(mǎ)、机器人动(dòng)作等多(duō)种(zhǒng)内(nèi)容形式的生成。不难发现该(gāi)项(xiàng)技术(shù)不仅(jǐn)在(zài)游(yóu)戏等行(xíng)业能得到有(yǒu)效应(yīng)用,对(duì)于下一代互联网(wǎng)各种元(yuán)素的构建亦有关键(jiàn)意义。

从商业化的角度来看,文化娱乐、教(jiào)育、传媒等诸多(duō)领域,本身就对基于AI的可视化内容(róng)有强烈需求。

因此,AI绘(huì)画及视(shì)频(pín)或不是结果,而只(zhǐ)是AI进(jìn)程中(zhōng)的一块重(zhòng)要拼图,有(yǒu)望(wàng)在技术更新(xīn)的加(jiā)持下实现更大的(de)应用价值(zhí)。

AI从理解内容,走向(xiàng)了可以生成内(nèi)容,甚至能够创造出独立价值和独立视角的内(nèi)容。AIGC的再次(cì)出圈,更代表着未(wèi)来(lái)的先进生产力即将到来(lái)。

ChatGPT之后(hòu)又一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能(néng)量

04

紧抓大(dà)模型与算力,牢固(gù)AIGC底座

从技(jì)术(shù)的(de)发展(zhǎn)也可(kě)以(yǐ)看出,在语言大模型、图像大模型(xíng)之(zhī)后,多(duō)模(mó)态大模型(xíng)已经成为了新的趋(qū)势。

大模型被誉为当前人(rén)工智能发展的(de)智能底座,是(shì)全球竞争最激烈的研(yán)究方向(xiàng)之(zhī)一,包括谷歌、亚马(mǎ)逊(xùn)、百度(dù)、阿里、腾讯等众多头(tóu)部企业都在竞相(xiāng)发(fā)力。

不(bù)过训(xùn)练大模型(xíng)的确价格(gé)不菲,以国(guó)盛证券发布的(de)《ChatGPT需要多少(shǎo)算力》报告估算,GPT-3训练一次的成(chéng)本约为(wèi)140万美元。而对于一些(xiē)更大的LLM(大型语言模型),训练成本则介于200万美元至1200万美元高价(jià)之间。

以ChatGPT在2023年1月(yuè)的(de)独立访客平均数(shù)1300万计(jì)算,其(qí)对应(yīng)芯片需求为(wèi)3万多片英伟达A100 GPU,初始(shǐ)投入成本约为8亿(yì)美元,每日仅电费就(jiù)在5万美元(yuán)左右。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌(pái)科(kē)技行业?_黑料(liào)正能量

此外不论是ChatGPT还(hái)是AIGC,都离不(bù)开庞大(dà)算(suàn)力支(zhī)持。在关注各(gè)类(lèi)大模型(xíng)的发展同时,更应(yīng)该关注(zhù)算力网络的(de)建设。

算力网络(luò)正驱动AI产业发(fā)展进入史(shǐ)诗级(jí)加速进(jìn)程(chéng),让(ràng)AIGC及通用AI这(zhè)一人工智(zhì)能发展的终极(jí)目标离得(dé)更近。

因为(wèi)算力(lì)可以(yǐ)对突破性(xìng)技术创新(xīn)提供大(dà)力的支持。这方面(miàn),多(duō)模态大(dà)模型(xíng)是(shì)典型。作为(wèi)面(miàn)向未来强人工智能(néng)、通用人工智能的重要技术(shù)创新,多模(mó)态大模型已(yǐ)经在人工(gōng)智能领域提(tí)出了很多年,业界(jiè)也有(yǒu)不少(shǎo)技术(shù)突破,但是,多模(mó)态(tài)大模型进一步(bù)往下走(zǒu),算力(lì)需求呈(chéng)几何式(shì)上(shàng)升,一(yī)般的算力基础设施很快将难以胜任。

从图(tú)像(xiàng)、文字、语音单独一项的训(xùn)练(liàn),到双模态(tài)、三(sān)模态(tài)的跃迁,让人工智(zhì)能可以灵(líng)活应对不同(tóng)模(mó)态的(de)转化、像人与世界(jiè)交互一样自然(rán),这方面(miàn),由算力网(wǎng)络来(lái)驱(qū)动将有明显优势。

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正(zhèng)能量(liàng)

此外,还有很多需要爆(bào)发式增长的算力来支撑(chēng)的技(jì)术创新,将在人(rén)工智能算力网络支撑下快速推进。

AIGC已经露出曙光(guāng),期待在大模型和大(dà)算力的支持下(xià)AIGC能(néng)持续颠覆内容生产的方式,将创(chuàng)造的边际成本降低(dī),让(ràng)万众受益。

未经允许不得转载:橘子百科-橘子都知道 微端是什么意思 手机端玩的叫微端吗

评论

5+2=