The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.673042
AFN 72.000368
ALL 87.274775
AMD 390.940403
ANG 1.80229
AOA 912.000367
ARS 1137.970104
AUD 1.565349
AWG 1.8
AZN 1.70397
BAM 1.720686
BBD 2.017877
BDT 121.428069
BGN 1.721593
BHD 0.376901
BIF 2930
BMD 1
BND 1.312071
BOB 6.906563
BRL 5.808204
BSD 0.999437
BTN 85.314611
BWP 13.77569
BYN 3.270808
BYR 19600
BZD 2.007496
CAD 1.384165
CDF 2877.000362
CHF 0.81849
CLF 0.025203
CLP 967.160396
CNY 7.30391
CNH 7.30369
COP 4310
CRC 502.269848
CUC 1
CUP 26.5
CVE 97.403894
CZK 22.038604
DJF 177.720393
DKK 6.56557
DOP 60.503884
DZD 132.56604
EGP 51.126904
ERN 15
ETB 133.023649
EUR 0.879325
FJD 2.283704
FKP 0.753159
GBP 0.753835
GEL 2.740391
GGP 0.753159
GHS 15.56039
GIP 0.753159
GMD 71.503851
GNF 8655.503848
GTQ 7.698128
GYD 209.656701
HKD 7.763675
HNL 25.908819
HRK 6.612104
HTG 130.419482
HUF 359.10504
IDR 16862.9
ILS 3.68639
IMP 0.753159
INR 85.377504
IQD 1310
IRR 42125.000352
ISK 127.590386
JEP 0.753159
JMD 157.965583
JOD 0.709304
JPY 142.384504
KES 129.503801
KGS 87.233504
KHR 4015.00035
KMF 433.503794
KPW 899.977001
KRW 1418.390383
KWD 0.30663
KYD 0.832893
KZT 523.173564
LAK 21630.000349
LBP 89600.000349
LKR 298.915224
LRD 199.975039
LSL 18.856894
LTL 2.95274
LVL 0.60489
LYD 5.470381
MAD 9.275039
MDL 17.289555
MGA 4552.892736
MKD 54.091003
MMK 2099.608303
MNT 3548.057033
MOP 7.990393
MRU 39.435529
MUR 45.090378
MVR 15.403739
MWK 1736.000345
MXN 19.71941
MYR 4.407504
MZN 63.905039
NAD 18.856894
NGN 1604.703725
NIO 36.775056
NOK 10.47246
NPR 136.503202
NZD 1.67405
OMR 0.384998
PAB 0.999437
PEN 3.763039
PGK 4.133235
PHP 56.712504
PKR 280.603701
PLN 3.762405
PYG 7999.894426
QAR 3.640604
RON 4.378104
RSD 103.137317
RUB 82.174309
RWF 1415
SAR 3.752237
SBD 8.368347
SCR 14.241693
SDG 600.503676
SEK 9.62027
SGD 1.310745
SHP 0.785843
SLE 22.775038
SLL 20969.483762
SOS 571.503662
SRD 37.15037
STD 20697.981008
SVC 8.745073
SYP 13001.68631
SZL 18.820369
THB 33.347038
TJS 10.733754
TMT 3.5
TND 2.988038
TOP 2.342104
TRY 38.020804
TTD 6.781391
TWD 32.524038
TZS 2687.503631
UAH 41.417687
UGX 3663.55798
UYU 41.913007
UZS 12986.521678
VES 80.85863
VND 25870
VUV 121.398575
WST 2.784098
XAF 577.111964
XAG 0.030658
XAU 0.000301
XCD 2.70255
XDR 0.717698
XOF 575.000332
XPF 102.775037
YER 245.250363
ZAR 18.821904
ZMK 9001.203587
ZMW 28.458439
ZWL 321.999592
  • AEX

    -1.3700

    852.2

    -0.16%

  • BEL20

    -3.3600

    4197.65

    -0.08%

  • PX1

    -43.9800

    7285.86

    -0.6%

  • ISEQ

    -177.5500

    9967.91

    -1.75%

  • OSEBX

    0.7200

    1447.47

    +0.05%

  • PSI20

    -10.1200

    6735.84

    -0.15%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    3.1800

    2654.25

    +0.12%

  • N150

    5.1900

    3250.59

    +0.16%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM