El reconocimiento de voz en Windows no es nada nuevo, y Word ha tenido incorporado el dictado multilingüe durante algún tiempo. Pero esto es para cuando quieres decir exactamente lo que quieres ver en la página. Capturar una conversación o reunión completa, para que pueda escuchar, pensar y hablar sin tener que escribir notas febrilmente para consultarlas más tarde, es otro tipo de flujo de trabajo.

Ya hay una serie de opciones, desde la opción de transcripción de reuniones en Teams (que solo funciona para la organización que organiza la reunión, pero no para invitados externos) hasta servicios como Otter que graban en un navegador o en su teléfono inteligente y transcriben a la nube. . Los desarrolladores pueden usar las API de Azure Cognitive Services para crear su propia aplicación de transcripción (el CTO de Azure, Mark Russinovich, creó una aplicación para teléfonos inteligentes para grabar sus reuniones hace unos años).

VER: Cómo agregar hipervínculos a un documento de Word (República Tecnológica)

Todos los usuarios de Office ahora pueden obtener transcripciones usando el mismo backend gracias a la nueva función de transcripción de Word, que convierte lo que se dice en una reunión o conversación en una transcripción que puede usar como referencia al escribir un documento.

Puede escribir sus propias notas mientras se graba la transcripción, pero no verá cómo se realiza la transcripción en tiempo real (porque el texto en pantalla puede distraer o hacer que las personas se sientan incómodas al hablar). Cuando deja de grabar, la transcripción aparece muy rápidamente en el panel Transcribir y puede copiarla, en parte o en su totalidad, desde el panel al documento mismo. Si solo desea una sección, haga clic en el botón + que aparece cuando pasa el mouse sobre ella; si desea la transcripción completa, haga clic en el botón "Agregar todo al documento" en la parte inferior del panel.

Si ya tiene una grabación (en formato WAV, MP3, MP4 o M4A), puede subirla a un documento de Word para transcribirla. No hay límite en la cantidad de reuniones y conversaciones que puede grabar y transcribir en vivo, pero solo puede cargar 300 minutos (5 horas) de audio por mes y los archivos de audio no pueden exceder los 200 MB (aunque aumentará). La cantidad de minutos de grabación cubiertos por el tamaño del archivo varía según el formato de archivo y el códec que esté utilizando; si grabas en MP3 en un iPhone, 200 MB almacenarán más de tres horas de voz.

Según Microsoft, la descarga y transcripción de un archivo de audio tomará aproximadamente el mismo tiempo que la duración del archivo, pero será más rápido en el futuro; nuestra prueba de un MP3 de 51 minutos duró poco menos de 50 minutos.

También hay nuevas opciones para la opción Dictar que ya está en Word, que no necesita una suscripción de Microsoft 365, solo para que inicie sesión con una cuenta de Microsoft. Además de solo dictar texto, ahora puede usar comandos de voz en Word para la web para dar formato al texto, crear listas y agregar comentarios a un documento que está revisando; dejar comentarios es especialmente útil si lo hace en una tableta en lugar de una computadora portátil, porque no tiene que sacar un teclado. Los comandos de voz inicialmente solo están disponibles en Word para web y dispositivos móviles, pero estarán disponibles en Word de escritorio en Windows y Mac antes de finales de 2020 para los suscriptores de Microsoft 365.

Índice
  • Genial con algunas peculiaridades
  • Genial con algunas peculiaridades

    Transcribe es una función muy útil e integrarla en un producto de consumo como Word la acercará a un público mucho más amplio. Pero tiene una serie de limitaciones.

    Abrir un documento de Word con una transcripción en el escritorio de Word parece eliminar la transcripción del archivo.
    Imagen: Mary Branscombe/TechRepublic

    Para empezar, solo está disponible en Word en la web, luego en las versiones móviles de Word. "La integración de Transcription en Word en la web significa que funciona en cualquier computadora con cualquier software de reunión, y también estará disponible a fines de año para teléfonos Android e iOS", dijo Dan Parish, director senior de Microsoft Group. para Natural UI & Incubation, dice. Eso significa que no está disponible en la aplicación de escritorio de Word en Windows o macOS. “Actualmente estamos revisando cuándo y cómo podríamos querer expandirnos a otras plataformas”, dijo Parish.

    Debe usar Chrome o el nuevo navegador Edge y tener una suscripción a Microsoft 365 (que incluye planes para empresas, consumidores y educación).

    El inglés americano es el único idioma compatible actualmente (Dictate admite nueve idiomas, incluidos tres dialectos del inglés), con 12 más en versión preliminar. Microsoft dijo que está trabajando para que Transcribe esté disponible en más lugares e idiomas.

    Para los acentos estadounidense y británico con los que probamos brevemente la transcripción de Word, la precisión es alta pero no perfecta. (Por cierto, Word reconoce correctamente las palabrotas, pero se convierten en asteriscos en la transcripción).

    A modo de comparación, transcribiendo la misma conversación de un chat de Teams de alta calidad en Word (en el nuevo navegador Edge en un Surface Book 2) y en Otter en un teléfono Android (que es menos preciso que usar Otter integrado en una reunión de Zoom), vimos un número similar de errores; hubo palabras en las que ambas herramientas se equivocaron ("dolor" por "flap", por ejemplo) y otros errores que cometieron de manera diferente.

    Por otro lado, Word lo hizo extremadamente bien al transcribir una grabación descargada de alguien hablando a través de un micrófono en una habitación grande con algo de ruido en la grabación y toses y susurros ocasionales, que es el tipo de calidad que algunas herramientas de transcripción rechazan. Hubo algunos errores homónimos ('son' por 'nuestro' y 'bill' por 'construir') y algunos neologismos muy extraños ('engenh' por 'motor' y 'kenik' por 'puede'), pero solo detectamos unas decenas de errores en la transcripción de 10.000 palabras.

    La probabilidad de errores ocasionales hace que sea extremadamente útil tener la transcripción en un panel al costado de la ventana donde puede reproducir el audio para escuchar lo que se dijo (y corregir cualquier error usted mismo). Pero saltar a la parte derecha del audio es confuso, porque tienes que hacer clic en la marca de tiempo de la sección de la transcripción que deseas, no en el texto de la transcripción, lo que parece natural (especialmente si usaste otros servicios de transcripción).

    Puede editar la transcripción en el panel Transcripción, pero el corrector ortográfico no funciona allí ni la búsqueda. Entonces, si desea revisar la ortografía o encontrar una frase específica en una conversación larga, deberá agregar la transcripción al documento.

    Puede optar por dejar la transcripción adjunta cuando comparte un documento o eliminarlo. Pero el destinatario deberá abrir el documento en Word en la web para ver la transcripción adjunta. En nuestras pruebas, abrir el documento en la versión de escritorio de Word y luego guardarlo con la transcripción eliminada resultó en un error cuando intentamos acceder a él en Word para la web. Puede recuperar la transcripción volviendo a una versión anterior del documento, pero la interfaz lo guía para eliminar la transcripción y comenzar una nueva en su lugar.

    Actualmente, no puede agregar varias transcripciones al mismo documento, por lo que si desea utilizar varias fuentes para la investigación, debe crear un nuevo documento para cada una o eliminar la primera transcripción después de extraer lo que necesita e insertar una nueva. una.

    Por razones de privacidad, aunque Word divide la transcripción entre diferentes hablantes, no intenta identificar quién está hablando, aunque si escribe un nombre para uno de los hablantes que se usará a lo largo de la transcripción. E incluso si graba una segunda o tercera conversación con la misma persona, Word no aprenderá su voz (o la suya) ni la nombrará; nuevamente, esto es por razones de privacidad, ya que el servicio de transcripción no almacena el audio ni la transcripción.

    “Sus archivos de audio se envían a Microsoft, pero solo para brindarle un servicio; cuando se completa la transcripción, nuestro servicio no almacena el audio ni los resultados de la transcripción. El archivo de audio en sí se almacena en su propio OneDrive personal”, dijo Parish.

    Es un poco menos conveniente que crear una biblioteca de voces y nombres, pero también cumple con los principios de privacidad para todas las experiencias conectadas de Office. Sería bueno ver opciones como poder apuntar a una reunión de Outlook para obtener nombres en lugar de tener que escribirlos a mano.

    Lamentablemente, para las organizaciones que deseen extraer su acumulación de reuniones y eventos grabados con fines de investigación, no puede comprar minutos de transcripción adicionales para las descargas (aunque Microsoft lo considerará como una opción si los clientes lo solicitan). Si desea transcribir más de 300 minutos de grabaciones existentes por persona por mes, siempre puede encontrar un lugar tranquilo y reproducir las grabaciones en vivo en un documento de Word. Pero cualquier organización que quiera hacerlo a escala encontrará otros servicios más convenientes (ya sea un servicio de transcripción como Otter que ofrece planes empresariales ilimitados o la creación de su propio sistema con Azure Cognitive Services y Power Automate).

    Algunas de estas limitaciones son peculiaridades menores, otras son inconvenientes que esperamos se resuelvan a tiempo. Con el estrés adicional que la pandemia impone a todos, cualquier característica que pueda mejorar la productividad es bienvenida, y cualquier persona que necesite extraer información de reuniones y llamadas encontrará esto muy útil, por lo que tiene sentido que Microsoft lo publique rápidamente, incluso si es no tan pulido como nos gustaría.

    Pero debido a que es tan útil, nos gustaría ver una versión mucho más completa de la función Transcribir. Y si bien la capacidad de insertar fragmentos y citas directamente en el documento de Word en el que está trabajando es útil, también nos gustaría ver que llegue a más aplicaciones de Office, especialmente OneNote, ahora que el desarrollo se ha reiniciado en Microsoft Office. aplicación precisamente para que pueda adoptar más funciones en el resto de Office.