Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
Aujourd’hui — 14 décembre 2025Flux principal

WhatsApp Reinvents Voicemail as It Adds AI Image Tools and Emoji Reactions

Par : David Curry
12 décembre 2025 à 14:58

The company is rolling out voicemail-style voice and video messages, emoji reactions in voice chats, and new AI image tools, even as major security flaws raise fresh risks.

The post WhatsApp Reinvents Voicemail as It Adds AI Image Tools and Emoji Reactions appeared first on TechRepublic.

Disney Seeks AI-topia With $1B Investment in OpenAI

12 décembre 2025 à 11:43

The three-year licensing agreement grants OpenAI's Sora video generator unprecedented access to more than 200 characters from Disney's vast catalog.

The post Disney Seeks AI-topia With $1B Investment in OpenAI appeared first on TechRepublic.

Gemini 3 launch had less of an impact on ChatGPT than CEO Sam Altman feared — OpenAI eyes January exit from "code red"

OpenAI finally launched its GPT-5.2 model after CEO Sam Altman declared code red following Google's successful Gemini 3 launch. The model ships with advanced capabilities across coding, text, image, and video.

Sam Altman, CEO of Open AI, is pictured on September 25, 2025 in Berlin, Germany.

Disney's $1 billion investment in OpenAI brings Mickey Mouse to Sora AI's doorstep — will it redefine Hollywood's future?

The Walt Disney Company announced that it is investing $1 billion in OpenAI in a new three-year licensing agreement, which will allow Sora to create user-prompted social videos from its copyrighted content.

General views of the The Walt Disney Company corporate headquarters, home of Walt Disney Studios on June 24, 2022 in Burbank, California

À partir d’avant-hierFlux principal

Nano-PDF - Éditez vos PDF grâce à l'IA Nano Banana

Par : Korben
1 décembre 2025 à 12:10

Modifier un PDF, c’est toujours la galère surtout si c’est un PDF avec que des images sans texte sélectionnable. Soit vous avez Adobe Acrobat qui coûte une couille, soit vous vous tapez des outils en ligne douteux, soit vous exportez en Word et vous priez pour que la mise en page survive. Bref, vous faites vos trucs de losers….

Mais ça c’était sans compter sur Nano-PDF qui propose une approche radicalement différente : Vous décrivez ce que vous voulez changer en langage naturel, et l’IA se chargera du reste.

Par exemple, si vous avez une présentation PDF avec une faute de frappe sur la slide n°5, au lieu de galérer avec un éditeur, vous tapez juste

`nano-pdf edit ma_presentation.pdf 5 "Corrige la faute sur le mot 'investisement'"`

Et hop, c’est réglé. Vous voulez mettre à jour un graphique avec les données de 2025 ? Pareil, vous décrivez le changement et l’outil se débrouille !

Nano-PDF utilise le modèle Gemini 3 Pro Image de Google (surnommé “Nano Banana Pro”) pour interpréter vos instructions et générer les modifications visuelles. Le workflow technique est d’ailleurs bien fichu puisque les pages PDF sont converties en images via Poppler , envoyées au modèle avec votre prompt, puis les images générées sont reconverties en PDF avec une couche de texte restaurée par OCR via Tesseract. Du coup, vos PDF restent sélectionnables et cherchables après modification, contrairement aux solutions qui vous filent des images aplaties.

Côté fonctionnalités, y’a pas mal de choses sympas. Vous pouvez par exemple éditer plusieurs pages en une seule commande, créer de nouvelles slides qui respectent le style visuel de votre deck existant, même utiliser des pages de référence pour que l’IA comprenne mieux votre charte graphique, et le traitement par lot est géré en parallèle pour gagner du temps sur les grosses présentations.

L’installation passe par pip avec

`pip install nano-pdf`

Et comme je vous le disais, il vous faudra aussi Poppler pour le rendu PDF et Tesseract pour l’OCR. Et attention, petit détail qui a son importance, l’API Gemini Pro Image nécessite un compte payant. Faudra sortir la thune car les clés gratuites ne permettent pas de générer des images… donc bon, prévoyez quelques euros de crédit Google Cloud si vous voulez tester.

Le truc cool, c’est par défaut c’est du 4K en résolution, mais vous pouvez descendre en 2K ou 1K si vous voulez économiser sur les coûts d’API. Y’a aussi une option --use-context qui envoie tout le texte du PDF au modèle pour qu’il comprenne mieux le contexte de vos modifications. Et si vous créez une nouvelle slide, cette option est activée par défaut pour que le résultat soit cohérent avec le reste du document.

Voilà, si vous passez votre vie à modifier des présentations PDF et que vous en avez marre des workflows à rallonge, installez Nano-PDF . C’est open source sous licence MIT, et ça change la vie !

Merci Lorenper pour le partage !

❌
❌