Yapay zeka dijital insanı "sıradan insanların evine uçuruyor"

2025 yılında Japonya'nın Osaka Expo'sunda Çin Pavilyonu Nisan ayından itibaren açıldığından beri, birçok ziyaretçiyi "günlük devamlılık" etmeye çekti. Ziyaretçiler Çin Pavilyonu'na girdiğinde, uzaktan "俺老孙来也" sesini duyabiliyorlar. Bu ses, Keda Xunfei Co., Ltd. (bundan böyle "Keda Xunfei" olarak anılacaktır) tarafından Çin Pavilyonu için oluşturulan, Çince, Japonca ve İngilizce dillerinde yetkin olan "AI Sun Wukong"dan gelmektedir. Görünümü ve sesi, klasik animasyon filmi "Büyük Kargaşa Cenneti"ndeki Sun Wukong'u yeniden canlandırmaktadır.

"AI Sun Wukong" arkasında, son yıllarda hızla gelişen dijital insan teknolojisi bulunuyor. AI, metaverse gibi yeni ortaya çıkan endüstrilerin ana bağlantı noktası olarak, dijital insanların dijital ekonomi gelişimindeki rolü giderek daha önemli hale geliyor. Büyük model teknolojisinin bu alandaki derin uygulamalarıyla, dijital insanlar "kullanılabilir" olmaktan "kullanışlı" olmaya doğru ilerliyor ve ilgili endüstrileri yeni bir gelişim aşamasına taşıyor.

Üç ana uygulama senaryosu oluşturmak

Dijital insanlar, modelleme gibi çeşitli dijital zeka teknolojileri kullanılarak oluşturulan dijital akıllardır. İnsan görünümüne, sesi ve dili vardır, bedensel hareketleri simüle edebilir, düşünme yeteneğine sahiptir ve büyük modellerin desteğiyle öğrenme, üretme, etkileşim gibi işlevleri gerçekleştirebilir.

Teknoloji ve talebin iki yönlü itici gücüyle, ülkemizin dijital insan endüstri ekosistemi giderek gelişiyor, uygulama ölçeği sürekli genişliyor ve endüstri zincirinin üst ve alt kısımlarındaki üretim, işletme ve hizmet yetenekleri yavaş yavaş artıyor. Tianyancha verilerine göre, 2024 yılı itibarıyla, ülkemizde dijital insan ile ilgili işletme sayısı 1.144.000'e ulaştı, sadece 2024 yılının ilk 5 ayında 174.000'den fazla yeni kayıtlı işletme eklendi ve bu, dijital insan endüstrisinin pazar potansiyelini ve canlılığını gösteriyor.

Çin İnternet Derneği uzman danışma komitesi üyesi Wu Suoning'e göre, dijital insan teknolojisinin biçimsel kalmasını ve kaynak israfına neden olmasını önlemek için bir uygulama çıkışı bulmak şarttır; bu, dijital insan uygulamalarının hayata geçirilmesini noktasal olarak genişleterek ilerletmeyi gerektirir.

Uygulamalara yönelerek, dijital insan endüstrisi "teknoloji - senaryo - ticaret" kapalı döngü ekosistemini hızla inşa ediyor.

Çin İnternet Topluluğu tarafından yayınlanan "Çin Dijital İnsani Gelişme Raporu (2024)" (bundan böyle "Rapor" olarak anılacaktır) raporuna göre, dijital insanın uygulama senaryoları başlangıçta üç kategori oluşturmuştur: medya dijital insanları, hizmet dijital insanları ve endüstri dijital insanları. Bunlar arasında, medya dijital insan, dijital insan uygulamasının nispeten olgun bir biçimidir. Medya dijital insanlar etrafında oluşturulan sahnelerin sayısı %50'ye ulaşabilir ve gerçekçi görüntüleri ve akıcı dil ifadeleri, bilgi yaymanın etkileşimini ve ilgisini büyük ölçüde artırır.

Örneğin, geçen yıl Merkezi Yayın ve Televizyon İdaresi tarafından ilk kez sunulan "Yeni Yıl Teknoloji Gösterisi" - "Çin Bilim ve Teknoloji Yenilik Festivali"nde, sunucu Zhang Tengyue ile "AI Kopyası"nın aynı sahnede sunuculuk yaptığı bir sahne yer aldı. Bu, iFlytek'in iFlytek Zhi Zuo platformu temel alınarak oluşturulan "AI sunucu" sadece gerçek sunucularla aynı sese, ifadeye ve hareketlere sahip olmakla kalmıyor, aynı zamanda sunucu ile rahat bir şekilde iletişim kurabiliyor, karşı tarafın sözlerini doğru bir şekilde anlayabiliyor ve hızlıca uygun yanıtlar verebiliyor, etkileşim akıcılığı izleyicilerin gerçeği ayırt etmesini zorlaştırıyor.

Rapor, medya dijital insanları dışında, hizmet dijital insanlarının da kapsamlı bir şekilde güncellendiğini, daha güçlü etkileşim yeteneklerine sahip olduğunu ve senaryo sayısının oranının %30'a ulaştığını göstermektedir. Bu durum, kamu yönetimi, e-ticaret, finans gibi alanlarda geniş bir uygulama alanı bulmaktadır; sektör dijital insanları ise yeni yeni filizlenmeye başlamış olup, senaryo sayısının oranı %20'ye ulaşmış ve yavaş yavaş sağlık, eğitim ve kurumsal yönetimde rol oynamaktadır.

AI yenilikleri için bir giriş noktası olma umudu

Dijital insanlar, genel olarak gerçek insanlardan yönlendirilen, programlardan yönlendirilen ve şimdi de AI tarafından yönlendirilen üç aşamadan geçmiştir.

Erken dönemlerde insan tarafından yönlendirilen dijital insan, sanal dijital görüntüler sunabiliyordu, ancak esas olarak bilgisayar grafik modelleme ve hareket yakalama gibi teknolojilere dayanıyordu; arka planda yine de insanların dil, hareket gibi verileri sağlaması gerekiyordu. Program tarafından yönlendirilen dijital insanlar, artık insanlardan dil, hareket gibi verileri sağlamasını gerektirmiyor, ancak sabit bilgisayar programlarına dayandıkları için daha çok "dijital robot"a benziyorlar ve yüksek derecede insanlaştırma etkisi gerçekleştiremiyorlar. Son yıllarda, AI tarafından yönlendirilen dijital insanlar, sadece sesli okuma, hareket ve ifade gibi detaylarda daha gerçekçi hale gelmekle kalmayıp, ayrıca daha güçlü etkileşim ve düşünme yetenekleri geliştirmiştir.

"Birkaç yıl önce, dijital insanlar dudak şekilleri, uyumsuz ifadeler ve sert hareketler gibi problemler yaşayabilirdi. Bunun nedeni, dijital insanın kendisinin metnin anlambilimi hakkında iyi bir anlayışa sahip olmaması ve ifadelerin ve eylemlerin çoğunun, metin içeriğiyle doğru bir şekilde eşleştirilemeyen sınırlı önceden ayarlanmış kaynaklara dayanmasıdır. iFLYTEK'in dijital insan işinin başkanı Gao Jingwen, dijital insan alanında büyük model teknolojisinin derinlemesine uygulanmasıyla dijital insan ürünlerinin performansının yeni bir seviyeye ulaştığını söyledi.

Örneğin, geçen yıl Ekim ayında, iFLYTEK süper antropomorfik bir dijital insan yayınladı. Konuşmanın ritmine, tonlamasına ve içeriğine göre gerçek zamanlı olarak vücut hareketleri üretebilen, eylem ön ayar şablonlarının sınırlamalarını aşan ve dinamik sahnelerde dijital insanların ifade gücünü büyük ölçüde artıran büyük modellerin çok modlu difüzyon üretimine dayanmaktadır. Tencent'in Zhiying dijital insanı "görüntü klonlama" ve "ses klonlama" elde edebilir, kullanıcıların yalnızca az sayıda resim, video ve ses materyali yüklemesi gerekir ve hızlı bir şekilde kendi dijital insan klonlarını oluşturabilir ve tınılarını özelleştirebilirler. Alibaba'nın açık kaynaklı yapay zeka dijital insanı EchoMimic, statik görüntülere canlı konuşma ve ifade verebilir.

"Kısacası, büyük model teknolojisi, dijital insanların gerçekten anlamı anlamasını sağlamakla kalmaz, aynı zamanda metni anlama yeteneğine dayanarak hızlı bir şekilde uygun hareketler ve ifadeler üretebilir, bu da onları son derece gerçekçi hale getirir." Gao Jingwen söyledi.

Çin İnternet Derneği Başkanı Shang Bing, dijital insanların AI'nın aktif uygulama alanına dönüşmekte olduğunu, büyük veri, akıllı terminaller ve bedensel zeka gibi endüstrilerle olan bağlantı, entegrasyon ve birleşme derecelerinin yüksek olduğunu düşünmekte ve bu durumun bir sonraki nesil internetin aktif etkileşim arayüzlerinden biri haline gelebileceğini belirtmektedir. Yenilikçi uygulamaların somutlaşmasına, dijital insanlar gibi yeni iş biçimlerini keşfetmeye dikkat edilmeli ve ölçeklenebilir uygulama avantajlarının oluşumunu hızlandırmalıdır.

Wu Suoning de, dijital insanların AI uygulamaları için bir kırılma noktası ve AI yeniliği için bir giriş olduğuna inanıyor. AI destekli dijital insanların, her sektöre daha zengin ve çeşitli uygulamalar sunma potansiyeline sahip olduğu ve bu uygulamaların AI'nın pragmatik bir gelişim yoluna yönlendirilmesine yardımcı olabileceği umuluyor.

Kişiselleştirilmiş "dijital ikiz" oluşturmak

Dijital insanların yaygın kullanımı ile birçok senaryo dijital insanlardan daha yüksek talepler ortaya koymuştur.

"Örneğin, e-ticaret canlı yayını ve müşteri hizmetleri Soru-Cevap gibi senaryolar, dijital insanların gerçek zamanlı etkileşim yeteneği için son derece yüksek gereksinimler ortaya koydu. Dijital insanlar yalnızca kullanıcılarla gerçek zamanlı konuşmalar yapabilmeli, aynı zamanda diyaloğun içeriğine göre karşılık gelen eylemler ve ifadeler üretebilmelidir, aksi takdirde iş süreçlerinin verimliliğini etkileyecek ve kullanıcı deneyimini doğrudan etkileyecektir. Gao Jingwen, dijital insan video oluşturma modelinin verimliliğini artırmak için şirket ekibinin, konuşma ve metin girişini kompakt ara temsillere dönüştüren ve video boyutunu etkili bir şekilde sıkıştıran bir eylem temsili çıkarma teknolojisi geliştirdiğini açıkladı. Bu teknolojinin yardımıyla sistem, bir stenograf gibi giriş metninden ve sesten önemli bilgileri hızlı bir şekilde çıkarabilir, alakasız bilgi verilerinin miktarını azaltabilir ve buna göre videolar oluşturabilir, video oluşturmanın verimliliğini büyük ölçüde artırabilir ve dijital insanlar ve kullanıcılar arasındaki gerçek zamanlı etkileşimi sağlayabilir.

Şunu da belirtmek gerekir ki, dijital insan endüstrisi her ne kadar hızla gelişiyor olsa da hala hızlı bir büyüme döneminde yaşamaktadır. Gao Jingwen, şu anda dijital insan ürünlerinde bir homojenizasyon olgusu olduğuna ve kişiselleştirme ve özelleştirmenin gelecekte dijital insan endüstrisinin önemli bir gelişme yönü haline geleceğine inanıyor. Üretken yapay zeka teknolojisinin gelişmesiyle birlikte, dijital insanın üretim eşiği ve maliyeti hızla düşürüldü, üretim verimliliği ve içerik çeşitliliği önemli ölçüde iyileştirildi ve kullanıcıların kendi özelliklerine göre daha kişiselleştirilmiş dijital insan ürünleri yaratmaları bir gerçeklik haline geldi. Şimdi, kişiselleştirilmiş bir süper antropomorfik dijital insan, yalnızca bir fotoğraf, tek cümlelik bir kayıt ve diğer materyallerle oluşturulabilir, bu da dijital insan özelleştirmesi için önceden ayarlanmış materyallerin gereksinimlerini büyük ölçüde basitleştirir ve kullanıcının çalışma yolunu optimize eder.

郜静文 de, büyük model teknolojisinin dijital insanı "sıradan insanların evine uçurmasına" neden olduğunu kabul etti, ancak daha ayrıntılı bir etki elde etmek için hala büyük miktarda veri beslemesi ve etkileşim eğitimi yapılması gerektiğini belirtti. Ayrıca, beraberinde gelen gizlilik ihlalleri, veri güvenliği gibi sorunlar da göz ardı edilemez.

"Gelecekte her birimizin bir 'dijital kopyası' olabileceği, işimizi halletmemize yardımcı olabileceği, yaşamımızdaki sorulara cevap verebileceği ve bizimle birlikte olabileceği." dedi Gao Jingwen.

(Kaynak: Teknoloji Günlüğü)

Kaynak: Doğu Zenginlik Ağı

Yazar: Bilim ve Teknoloji Günlüğü

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)