Tradotto con l’IA di Lara Translate
La traduzione di documenti è più complessa della traduzione di testi. La formattazione si altera. Le tabelle collassano. Le colonne si spostano. Nei formati di localizzazione come XLIFF, la struttura deve rimanere inalterata e devono cambiare solo le stringhe traducibili.
L’API di traduzione adattiva di documenti di Lara Translate gestisce tutto questo. Preserva il layout, supporta oltre 70 formati di file tra Office, publishing, localizzazione e immagini e applica gli stessi controlli di contesto, stile, glossario e memoria di traduzione disponibili nell’API per la traduzione di testo, il tutto in un’unica chiamata.
In questo articolo spieghiamo come funziona l’endpoint per la traduzione di documenti, quali formati supporta, come configurarlo e a cosa prestare attenzione quando lo si integra in una pipeline di produzione.
|
TL;DR
- Cosa: L’API di traduzione di documenti di Lara Translate traduce 70 formati di file, preservandone il layout originale, in 206 lingue.
- Perché: la traduzione manuale dei documenti altera la formattazione, crea problemi di controllo delle versioni e non è scalabile. L’API gestisce congiuntamente struttura e contenuto.
- Come: carica il documento, specifica la combinazione linguistica e le opzioni (stile, contesto, glossario, TM) e ricevi il file tradotto. Traduzioni in blocco e multilingue con una sola chiamata.
- Aspetti da tenere presenti: Per impostazione predefinita, i file PDF vengono convertiti in DOCX; per ottenere in output un PDF, specificare
outputFormat="pdf". Per il contenuto delle immagini nei PDF, è necessario abilitare esplicitamente l’OCR durante il caricamento. Addebito minimo di 20.000 caratteri per documento per i piani Pro e Team.
- Strumenti: API Lara Translate Adaptive, Lara CLI, Lara MCP Server, plugin per Trados/MemoQ/MateCat. Consulta l’elenco completo dei formati.
|
|
Perché è importante
I team che gestiscono documentazione multilingue su larga scala non hanno bisogno solo di testo tradotto: hanno bisogno di documenti tradotti che abbiano lo stesso aspetto e si comportino come gli originali. L’API per la traduzione di documenti preserva il layout, mantiene l’integrità del formato di localizzazione e garantisce la coerenza terminologica in un’unica chiamata, eliminando la fase di riconciliazione manuale che di solito richiede tempo dopo la traduzione. Per i localization engineer, il supporto di formati come XLIFF, PO e TXML significa inoltre che l’API si integra direttamente nelle toolchain di localizzazione esistenti, senza oneri di conversione.
|
Risposta rapida
L’API di traduzione di documenti di Lara Translate supporta 70 formati di file, traduce mantenendo il layout e la struttura e restituisce il file tradotto nel formato originale (con una sola eccezione: per i file PDF di origine, per impostazione predefinita, viene restituito un file DOCX). Applica le impostazioni relative a contesto, stile, glossario e memoria di traduzione per ogni chiamata e supporta l’output multilingue in un’unica richiesta. Accesso tramite API REST o SDK per Python. Documentazione completa disponibile su developers.laratranslate.com.
Cosa fa l’API per la traduzione di documenti?
L’endpoint per la traduzione di documenti accetta un file, lo traduce in una o più lingue di destinazione e restituisce il file tradotto mantenendo intatto il layout originale. Le tabelle rimangono tabelle. Le colonne rimangono colonne. I layout delle diapositive rimangono tali.

Oltre alla conservazione del layout, ogni chiamata di traduzione di documenti può includere:
- Uno stile di traduzione (Fluido, Fedele o Creativo)
- Istruzioni sul contesto (pubblico, tono, settore, termini preferiti)
- Glossari personalizzati per una terminologia coerente
- Memorie di traduzione per il riutilizzo di traduzioni approvate
- Più lingue di destinazione in un’unica chiamata
Anche in questo caso, si applica lo stesso livello di personalizzazione previsto per la traduzione di testi. La differenza è che l’API gestisce automaticamente l’estrazione, la traduzione e la ricostruzione del file: non è necessario estrarre il contenuto, tradurlo e riassemblare il documento manualmente.
Quali formati di file supporta l’API per la traduzione di documenti?
Lara Translate supporta 70 formati di file in otto categorie. Per l’elenco ufficiale e aggiornato, consulta Formati di documento supportati nella traduzione di documenti con Lara Translate.
Tabella 1. Categorie di formati di file supportati dall’API di traduzione di documenti Lara Translate
| Categoria |
Formati |
Note |
| Documenti Office |
DOC, DOCX, DOCM, DOTX, DOTM, ODT, OTT, RTF, XLS, XLSX, XLSM, XLTX, XLTM, ODS, OTS, ODP, OTP, PPT, PPTX, PPTM, PPSX, PPSM, POTX, POTM |
Formati equivalenti a Word, Excel, PowerPoint e OpenDocument |
| PDF |
PDF |
Per impostazione predefinita, restituisce DOCX. Per ottenere un PDF, passare outputFormat="pdf". Per il contenuto delle immagini, è necessario che l’OCR sia abilitato durante il caricamento. |
| Apple iWork |
PAGES, NUMBERS, KEYNOTE |
File Pages, Numbers e Keynote |
| Desktop publishing |
MIF (FrameMaker), IDML (InDesign), ICML (InCopy), DITA, TEX |
Formati per l’editoria professionale e per documenti strutturati |
| Localizzazione |
XLF, XLIFF, PO, TTX, SRT, VTT, SBV, TXML, XINI |
Struttura preservata; vengono modificate solo le stringhe traducibili. Vedi anche: Guida alla traduzione XLIFF. |
| Interscambio |
CSV, TSV, XML, DTD, JSON, YAML |
File di dati e di configurazione. Vedi: Guida alla traduzione di file CSV. |
| Programmazione |
HTM, HTML, XHTML, TS, RESX, WIX, STRINGS, MD, PHP, PROPERTIES |
File di localizzazione per app e software |
| Immagini |
AVIF, BMP, GIF, HEIC, HEIF, PNG, JPG, JPEG, TIF, TIFF, WEBP |
Restituiti nello stesso formato. Per il testo presente nelle immagini è necessario l’OCR. |
| Testo semplice |
TXT |
|
Traduzione di PDF: cosa devi sapere
La traduzione di PDF funziona, ma presenta due comportamenti che è utile conoscere prima di basarci su di essa.
Il formato di output predefinito è DOCX. Quando carichi un PDF, l’API restituisce per impostazione predefinita un file DOCX. Se desideri ricevere il file di output in formato PDF, specifica outputFormat="pdf" nella tua chiamata. Non si tratta di un bug: ciò riflette il fatto che ricostruire un PDF perfetto a livello di pixel a partire da contenuti tradotti è più difficile che generare un documento Word ben formattato, e il formato DOCX offre una maggiore modificabilità.
Per tradurre il contenuto delle immagini, è necessario abilitare esplicitamente l’OCR. Il testo incorporato nelle immagini all’interno di un PDF (documenti scansionati, screenshot, pagine basate su immagini) non viene tradotto automaticamente. Per eseguire l’OCR su tale contenuto, è necessario abilitare la traduzione delle immagini durante il caricamento. Se carichi un PDF scansionato senza abilitare la traduzione delle immagini, il testo presente nelle immagini rimarrà non tradotto. Vedi: OCR nella traduzione di documenti e Traduzione di immagini all’interno di documenti PDF.
Come tradurre un documento tramite l’API: esempio con l’SDK per Python
Il modo consigliato per chiamare l’endpoint di traduzione dei documenti è tramite l’SDK Python di Lara Translate. La documentazione completa e ulteriori esempi sono disponibili su developers.laratranslate.com.
from laratranslate import Lara
# Effettua l'autenticazione con le tue credenziali
lara = Lara(
access_key_id="YOUR_ACCESS_KEY_ID",
access_key_secret="YOUR_ACCESS_KEY_SECRET"
)
# Traduci un documento
result = lara.documents.translate(
file="./product-manual.docx",
source="en",
target="fr",
instructions="Technical product documentation for enterprise IT teams. Faithful style required."
)
# Salva il documento tradotto
with open("./product-manual-fr.docx", "wb") as f:
f.write(result.content)
Per ottenere l’ID e la chiave segreta di accesso, consulta: Configurazione della chiave API per Lara Translate. Per monitorare l’utilizzo, consulta: Come monitorare l’utilizzo dell’API.
Tradurre in più lingue con un unico API call
L’API per la traduzione di documenti supporta più lingue di destinazione per chiamata. Se si passa un array di codici lingua nel parametro target, l’API restituisce, nella stessa risposta, i file tradotti per ciascuna coppia linguistica.
In questo modo, si riducono i costi generali dell’API e si semplifica la logica della pipeline per i team che gestiscono simultaneamente release multilingue in diversi mercati. Anziché eseguire chiamate singole per ciascuna lingua e gestire più attività asincrone, si ottengono tutti i risultati con un’unica richiesta.
Traduzione di documenti in blocco
Per i flussi di lavoro ad alto volume, l’API supporta la traduzione di più documenti contemporaneamente. La guida alla traduzione di più documenti illustra il flusso di traduzione in blocco e come gestire l’accodamento dei lavori.
Per i team che eseguono la traduzione nell’ambito di una pipeline CI/CD o di un flusso di lavoro per la pubblicazione di contenuti, la CLI di Lara gestisce i lavori di traduzione di documenti in blocco senza la necessità di script personalizzati, utile per localizzare documentazione, note di rilascio o contenuti esportati da un CMS a ogni distribuzione.
Opzioni di personalizzazione per la traduzione di documenti
Ogni chiamata per la traduzione di documenti può includere gli stessi parametri di personalizzazione disponibili nell’API per la traduzione di testi.
Stile di traduzione. Fluido per una leggibilità generale, Fedele per contenuti tecnici o legali dove la precisione è fondamentale, Creativo per materiali di marketing e brand. Applicato end-to-end all’intero documento. Vedi: Stili di traduzione in Lara Translate.
Istruzioni di contesto. Per ogni chiamata, fornisci indicazioni su pubblico, tono, settore e terminologia preferita. Il modello utilizza queste informazioni per orientare le scelte traduttive in tutto il documento. Vedi: Funzionalità Contesto: casi d’uso comuni ed esempi pratici.
Glossari personalizzati. Carica la terminologia una sola volta e applicala a ogni chiamata per la traduzione di documenti. I nomi dei prodotti, i termini legali e il vocabolario del marchio rimangono coerenti, indipendentemente dal tipo di documento o dal volume. Vedi: Come funzionano i glossari in Lara Translate.
Memorie di traduzione. Le traduzioni approvate vengono memorizzate e riutilizzate a livello di segmento. Nei set di documenti di grandi dimensioni, i contenuti ripetuti vengono gestiti in modo coerente, senza dover tradurre nuovamente quelli già approvati. Vedi: Cos’è un sistema di gestione delle traduzioni (TMS)?
Nota sulla fatturazione: addebito minimo per numero di caratteri
Nei piani Pro e Team, per ogni richiesta di traduzione di documenti viene addebitato un minimo di 20.000 caratteri, indipendentemente dalla lunghezza effettiva del documento. Per i documenti brevi (ad esempio, un brief di una pagina o una breve nota di rilascio), si applica questo minimo. Tenete conto di questo aspetto nella vostra stima dei costi quando progettate flussi di lavoro che prevedono un volume elevato di documenti brevi. In questi casi, raggruppare i contenuti in un numero minore di richieste più voluminose è più conveniente rispetto all’invio di numerosi file di piccole dimensioni singolarmente.
Formati di localizzazione supportati: XLIFF, PO, SRT e altri
I formati specifici per la localizzazione ricevono un trattamento speciale: l’API modifica solo il contenuto delle stringhe traducibili, lasciando intatti la struttura del file, gli attributi, gli ID e i metadati. Ciò è fondamentale per formati come XLIFF e PO, che vengono utilizzati direttamente dagli strumenti di localizzazione e dalle piattaforme CAT: qualsiasi modifica strutturale comprometterebbe la compatibilità della toolchain a valle.
Formati di localizzazione supportati: XLF, XLIFF, PO, TTX, SRT, VTT, SBV, TXML, XINI.
Per i team che già utilizzano Trados Studio, MemoQ o MateCat, Lara Translate offre integrazioni plugin native che collegano l’API Adaptive direttamente al flusso di lavoro del CAT tool, senza la necessità di esportare e reimportare manualmente i file. Vedi: Lara Translate per MemoQ.
Articoli correlati di questa serie
Domande frequenti
Quali formati di file supporta l’API di traduzione di documenti di Lara Translate?
L’API di traduzione di documenti di Lara Translate supporta 70 formati di file, tra cui documenti Office (DOCX, XLSX, PPTX e relative varianti), PDF, file Apple iWork (PAGES, NUMBERS, KEYS), formati di desktop publishing (IDML, ICML, MIF, DITA, TEX), formati di localizzazione (XLIFF, PO, SRT, VTT, TXML, XINI), formati di interscambio (CSV, JSON, XML, YAML), file di programmazione (HTML, RESX, STRINGS, PROPERTIES), immagini (PNG, JPG, TIFF, WEBP e altri) e testo semplice. Per un riferimento completo, consulta l’elenco completo dei formati.
L’API per la traduzione di documenti preserva la formattazione e il layout?
Sì. La conservazione del layout è una funzionalità fondamentale dell’endpoint per la traduzione di documenti. Nella traduzione risultante vengono mantenuti tabelle, colonne, layout delle diapositive, formattazione incorporata e struttura del documento. Per i formati di localizzazione come XLIFF e PO, la struttura, gli attributi, gli ID e i metadati rimangono invariati: vengono modificate solo le stringhe traducibili.
Perché la traduzione di PDF restituisce di default un file DOCX?
Per i file di origine PDF, l’API restituisce per impostazione predefinita un file DOCX, poiché il formato DOCX è più modificabile e offre un maggiore controllo sull’output tradotto prima della finalizzazione. Se desideri ricevere il file tradotto in formato PDF, specifica outputFormat="pdf" nella tua chiamata. Questo comportamento è documentato nella documentazione dell’API all’indirizzo developers.laratranslate.com.
L’API traduce il testo all’interno delle immagini nei PDF?
Non per impostazione predefinita. Per tradurre il testo incorporato nelle immagini all’interno di un PDF (pagine scansionate, screenshot, contenuti basati su immagini) è necessario l’OCR, che deve essere abilitato esplicitamente durante il caricamento. Se la traduzione delle immagini non viene abilitata, tale contenuto rimane non tradotto. Vedi: OCR nella traduzione di documenti.
Posso tradurre un documento in più lingue con un’unica chiamata API?
Sì. Basta passare un array di codici delle lingue di destinazione nel parametro target e l’API restituirà, nella stessa risposta, i file tradotti per ciascuna lingua. Questa soluzione è più efficiente rispetto all’invio di una chiamata per lingua e alla gestione di job asincroni separati per ciascuna.
Come funziona la fatturazione per la traduzione di documenti?
Nei piani Pro e Team, ogni chiamata per la traduzione di documenti viene fatturata per un minimo di 20.000 caratteri. Anche se il documento è inferiore a 20.000 caratteri, ti verrà comunque addebitato l’importo minimo. Per i flussi di lavoro che includono molti documenti brevi, raggruppare i contenuti in un numero minore di richieste più voluminose è più conveniente in termini di costi.
Qual è il modo migliore per tradurre file XLIFF e di localizzazione tramite l’API?
Carica il file XLIFF o PO direttamente nell’endpoint per la traduzione di documenti. Lara Translate gestisce i formati di localizzazione con una logica che preserva la struttura: viene modificato solo il contenuto delle stringhe traducibili, mentre tutti gli attributi strutturali, gli ID e i metadati restano invariati. In questo modo, l’output è immediatamente compatibile con i vostri strumenti CAT e con la vostra pipeline di localizzazione. Vedi: Traduzione di file XLIFF con Lara Translate.
Traduci i tuoi documenti esattamente come richiede la tua pipeline
70 formati, layout preservato, glossario applicato, multilingue in un’unica chiamata. Traduzione di documenti di livello professionale tramite API.
Inizia a utilizzare l’API Adaptive Translation