The audience for earnings calls and reports is no longer only human. Natural language processing (NLP) programs are also listening and making important judgments about companies’ perceived performance, and even triggering real-time buying and selling. In response, many companies have changed the way they communicate in an attempt to get the desired results from NLP. In this week’s post we’ll examine this technology, look at current tools, and discuss results from GBM’s text analysis of Mexico’s 3Q21 Earnings Calls.
About AI Text/Voice Analysis in IR
First let’s define some of the terminology that is used in this space. Artificial intelligence (AI) refers broadly to the discipline of intelligent machines, while machine learning (ML) refers more specifically to systems that can learn from experience, and natural language processing (NLP), a subset of AI that uses ML, is a set of systems that can understand language and improve. NLP uses a combination of linguistics, neuroscience, mathematics and computer science. Recent advances in ML, along with increased computational potential, have made NLP more reliable and scalable.
An example of NLP in a more common context is Sonix, the company that converts audio to text, it first processes the audio with automated speech recognition (a type of machine learning) and then once it is in text format uses NLP to understand the meaning of the text (which can be quite complicated given abbreviations and colloquialisms). In finance, NLP is used for sentiment analysis, question-answering (chatbots), financial audits, document classification, and in general reducing the amount of manual labor. This blog will focus on sentiment analysis as it is most relevant to IR.
NLP financial sentiment analysis is being used to examine all kinds of written or audio inputs that can give company insight. This includes basic disclosure information like earnings calls, pitch presentations, and quarterly reports, but also goes beyond that with things like social media and news NLP sentiment analysis being used for real time trading. NLP programs are generally looking for frequency of certain terms and positive, neutral, or negative sentiments. However, it can even be capable of detecting the tone of voice of the speaker, for example to get a reading on positivity and excitement in an earnings call.
Traditionally corporate disclosures have tried to convey the desired sentiment and tones for humans listening or reading. However, a recent report by Stevens found that many large companies have changed the way they write reports and scripts; executives are even getting professional help from voice coaches to hit the right tone of voice for NLP. Companies are also using algorithmic programs to test drafts of their disclosures to gauge their expected sentiment score.
Programs/Services that examine financial language
In the sentiment analysis space, and in general, the top 4 financial tools are Bloomberg, S&P Capital IQ, FactSet, Refinitiv Eikon. We’ve also included some information on Dataminr, FinBERT, and Wordstat.
Bloomberg
Bloomberg (BBG) is able to identify a news story or tweet as being about a specific company and then assign it a sentiment score. BBG’s news sentiment analysis tool {TREN <GO>} allows investors or analysts to use news fragments to build statistical forecasting models that dynamically adjust price targets.
Besides being a leader in the financial language processing space, BBG is considered the top financial data tool with the highest market share in the space (33%). It is best used for fixed income (most comprehensive data sets), buy side, sales, trading, and asset management. A Bloomberg terminal costs approximately $25,000 USD per year.
Refinitiv
Refinitiv (20% market share, approx $22k per year for full version), is the most direct competitor of BBG. It’s focus is on sell side research. But in general is considered to be a less robust version of BBG, according to Wall Street Prep.
Refinitiv News Analytics, Refinitiv’s natural language processing engine, uses news sentiment machine learning. See this paper on its use in intraday forecasting of a major stock index and on daily trading of the 100 most liquid S&P 500 stocks.
S&P Global Market Intelligence (Capital IQ + SNL)
S&P (6.2% market share, approx $13,000 per user per year, minimum of 3 users) has a fleet of data scrubbers, searching footnotes and disclosures of earning reports for the numbers investment bankers need. It’s excel plug-in is considered high quality, but not as robust as FactSet’s. A nice touch is they send you $50 if you catch a mistake in their database, according to Wall Street Prep.
FactSet
FactSet, another leading financial data tool (4.5% of market share, and approximate cost of $12,000 per year), provides sentiment analysis for all of the earnings calls that they cover, giving scores by speaker, per section, overall, and word frequency analysis. They also have a document search tool which allows you to search through multiple companies. For example, in this study, FactSet looked at mentions of inflation in all of the S&P 500 earnings calls and found 2Q21 had the highest number of mentions since 2010, and the largest YoY increase.
Aside from language analysis, the FactSet tends to be more popular with investment bankers, because of specific capabilities such as ease of seeing data in source documents, excel plugins, pitchbook macros with PowerPoint, and transaction screening tools. However, it’s not considered to have the most robust equity research and data scrubbing capabilities are good but not quite at the level of S&P, according to Wall Street Prep.
DataMinr
DataMinr is a real time AI platform that uses public data to detect signals of high-impact events. For example, DataMinr provides real-time Twitter data that can be analyzed for trade support, market awareness, client advisory, and thesis generation.
FinBERT
FinBERT is based on a language representation model that was originally developed for biomedical text mining, and has been developed for the financial services sector. FinBERT operates on a dataset that contains financial news from Reuters and assigns sentiment using a phrase bank. Other than the cost to use Reuters it is free, but requires programming language knowledge to use. See more information at this Github page.
Wordstat
Provalis Research has a text mining tool called Wordstat. It’s not necessarily for financial data but can be used for that. It has python integrations to modify even more specifically, including dictionary building, mapping etc.
GBM Mexico Results
GBM used data science tools (unspecified) to analyze text as data in their recent report Top of Mind: Text Analysis from 3Q21 Earning Calls in Mexico and the World. They looked at Mexican quarterly earnings calls (400+) as well as global companies (22,700+) to identify common topics by word or phrase frequency.
In Mexico, there was a positive trend in corporates’ top-of-mind vocabulary. “Supply chain” mentions, like “raw materials”, had the biggest increases and were dominant in the earning calls, which was also observed with global companies. Growth was also widely mentioned, which is a positive sign across Mexican companies.
In terms of sentiment in Mexico, the proportion of negative pairs of words have continued to decline since 1Q20, while the list of positive words has remained stable. In 3Q21, 2.7% of monitored words were positive, and 1.6% were negative, compared to 1Q20 (1.7% positive, 7.0% negative). Arca Continental (AC) had the most positive mentions in its 3Q21 earnings call.
Other interesting findings from the report were:
- ESG and digital transformation topics continue to be on the rise in the Mexican corporate narrative, a trend that has been consistent over the past three years.
- Compared to global reports, Mexico had less mentions of “labor” as it is less of an issue than in the US.
- Pandemic – Mentions of the pandemic had a QoQ decrease of 2p.p.
- Growth – AC, KOF, WALMEX, CEMEX, and GCC had the most growth mentions.
- Supply Chain – The following companies had the highest number of mentions CUERVO (37), NEMAK (21), ORBIA (20), and KIMBER (18). Supply related words in 3Q21 were up to 7.9% in 3Q21, compared to 4.5% in 2Q21, and 2.3% in 3Q20.
- Pricing – Pricing/inflation was relevant this quarter, up by 2p.p. On a 3 year trend, but stable QoQ. CEMEX had the highest exposure, followed by KIMBER, AC, and ALFA.
- Cost – CEMEX had greatest exposure, mostly for “input costs”, followed by KIMBER, ORBIA (“cost increases”), and FIHO (“cost control” and “cost-cutting”).
- ESG- CEMEX’s mentions of “alternative fuels” gave it the most exposure, followed by KOF (sustainability), and GCC.
- Digital – GFNORTE had the most mentions of digital growth, followed by TLEVISA and GENTERA.
Miranda IR is happy to help your company with sentiment analysis prep for earning calls, we use several of the tools mentioned in this blog.
Sources
- https://gbmenlinea.gbm.com.mx/Documentosanalisis/dss_top_of_mind_3q21.pdf
- https://www.stevens.edu/sites/stevens_edu/files/Machine%20Reading%2020210311.pdf
- https://insight.factset.com/highest-number-of-sp-500-companies-citing-inflation-on-q2-earnings-calls-in-over-10-years
- https://provalisresearch.com/products/content-analysis-software/
- https://www.wallstreetprep.com/knowledge/bloomberg-vs-capital-iq-vs-factset-vs-thomson-reuters-eikon/
- https://gbmenlinea.gbm.com.mx/Documentosanalisis/dss_top_of_mind_3q21.pdf
- https://sonix.ai/articles/difference-between-artificial-intelligence-machine-learning-and-natural-language-processing
- https://www.avenga.com/magazine/nlp-finance-applications/
- https://www.bloomberg.com/professional/sentiment-analysis-white-papers/
- https://www.bloomberg.com/professional/blog/trading-news-use-machine-readable-data-find-alpha/
Contacts at Miranda Partners
Damian Fraser
Miranda Partners
damian.fraser@miranda-partners.com
Ana María Ybarra Corcuera
Miranda-IR
ana.ybarra@miranda-ir.com
El público de las llamadas e informes de resultados ya no es sólo humana. Los programas de procesamiento del lenguaje natural (PLN) también están escuchando y emitiendo juicios importantes sobre el rendimiento percibido de las empresas, e incluso detonando órdenes de compras y ventas en tiempo real. En respuesta a esto, muchas empresas han cambiado su forma de comunicarse en un intento de obtener los resultados deseados de los PLN. En el post de esta semana, examinaremos esta tecnología, analizando herramientas actuales, y discutiremos los resultados del análisis de texto de GBM de las conferencias de resultados del 3T21 en México.
Sobre el análisis de texto/voz de IA en IR
En primer lugar, definamos algunos de los términos que se utilizan en este ámbito. La inteligencia artificial (IA) se refiere en general a la disciplina de las máquinas inteligentes, mientras que el machine learning (ML) se refiere más específicamente a los sistemas que pueden aprender empíricamente. El procesamiento del lenguaje natural (PLN), es un subconjunto de la IA que utiliza el ML; un grupo de sistemas que pueden entender el lenguaje y mejorar su aprendizaje mediante el uso de una combinación de herramientas de lingüística, neurociencia, matemáticas e informática. Los recientes avances en ML, junto con el aumento del poder de procesamiento de las computadoras, han hecho que el PLN sea más confiable y escalable.
Un ejemplo del uso de PLN en un contexto más común es Sonix, una empresa que convierte el audio en texto. Primero, procesa el audio con reconocimiento de voz automatizado (un tipo de machine learning) y luego, una vez que está en formato de texto, utiliza PLN para entender el significado del texto (que puede ser bastante complicado dadas las abreviaturas y modismos). En finanzas, el PLN se utiliza para el análisis de sentimiento, la respuesta a preguntas (chatbots), las auditorías financieras, la clasificación de documentos y, en general, para reducir la cantidad de trabajo manual. Este blog se centrará en el análisis de sentimiento, ya que es la aplicación más relevante para las finanzas.
El análisis de sentimiento financiero con PLN se está utilizando para examinar todo tipo de información escrita o de audio que pueda aportar información sobre una empresa. Esto incluye la información básica de divulgación como las conferencias de resultados, las presentaciones corporativas y los reportes trimestrales, pero también va más allá con cosas como las redes sociales y el análisis de sentimiento con PLN de noticias relevantes que se usan para hacer trading en tiempo real. Los programas de PLN suelen buscar la frecuencia de uso de ciertos términos y los sentimientos positivos, neutrales o negativos asociados. Incluso, puede ser capaz de detectar el tono de voz del orador, por ejemplo, para obtener una lectura sobre la positividad y el entusiasmo en una conferencia de resultados.
Tradicionalmente, la comunicación de las empresas ha tratado de transmitir el sentimiento y el tono deseados por las personas que escuchan o leen. Sin embargo, un informe reciente elaborado por Stevens, reveló que muchas empresas grandes han cambiado su forma de redactar los reportes y guiones; los ejecutivos incluso están recibiendo ayuda profesional de entrenadores de voz para alcanzar el tono de voz adecuado para los programas de PLN. Las empresas también están utilizando programas algorítmicos para probar los borradores de sus publicaciones y calibrar su puntuación de sentimiento esperado.
Programas/servicios que examinan el lenguaje financiero
En el ámbito del análisis de sentimiento, y en general, las cuatro principales herramientas financieras son Bloomberg, S&P Capital IQ, FactSet y Refinitiv Eikon. También hemos incluido información sobre Dataminr, FinBERT y Wordstat.
Bloomberg
Bloomberg (BBG) es capaz de identificar si una noticia o un tuit se refieren a una empresa específica y asignarle una puntuación de sentimiento. La herramienta de análisis del sentimiento de las noticias de BBG {TREN <GO>} permite a los inversionistas o analistas utilizar fragmentos de noticias para construir modelos de previsión estadística que ajusten dinámicamente los objetivos de precios.
Además de ser líder en el espacio de procesamiento del lenguaje financiero, BBG está considerada como la principal herramienta de datos financieros con la mayor participación de mercado (33%). Se utiliza sobre todo para renta fija (conjuntos de datos más completos), buy side, ventas, trading y gestión de activos. Una terminal Bloomberg cuesta aproximadamente 25,000 dólares al año.
Refinitiv
Refinitiv (20% de participación de mercado, aproximadamente 22,000 dólares al año por la versión completa), es el competidor más directo de BBG. Se centra en la investigación del sell side. Pero en general, se considera una versión menos robusta de BBG, según Wall Street Prep.
Refinitiv News Analytics, el motor de procesamiento del lenguaje natural de Refinitiv, utiliza machine learning con el análisis de sentimiento de las noticias. Véase este artículo sobre su uso en la previsión intradía de un importante índice bursátil y en la negociación diaria de los 100 valores más líquidos del S&P 500.
S&P Global Market Intelligence (Capital IQ + SNL)
S&P (6.2% de participación de mercado, aproximadamente 13,000 dólares por usuario al año, con un mínimo de tres usuarios) dispone de una flota de depuradores de datos, que buscan en las notas al pie de página y en los anexos de los reportes de resultados las cifras que necesitan los banqueros de inversión. Su plug-in de Excel se considera de alta calidad, pero no tan robusto como el de FactSet. Un buen detalle es que te envían 50 dólares si detectas un error en su base de datos, según Wall Street Prep.
FactSet
FactSet, otra de las principales herramientas de datos financieros (4.5% de la participación de mercado y un costo aproximado de 12,000 dólares al año), ofrece un análisis de sentimiento para todas las llamadas de resultados que cubren, dando calificaciones por orador, por sección, en general, y un análisis de frecuencia de palabras. También disponen de una herramienta de búsqueda de documentos que permite buscar varias empresas simultáneamente. Por ejemplo, en este estudio, FactSet analizó las menciones a la inflación en todas las conferencias de resultados del S&P 500 y descubrió que en el 2T21 se produjo el mayor número de menciones de ésta desde 2010, así como el mayor incremento interanual.
Aparte del análisis lingüístico, FactSet tiende a ser más popular entre los banqueros de inversión, debido a capacidades específicas como la facilidad de ver los datos en los documentos fuente, los plug-ins de Excel, las macros de pitchbook con Powerpoint y las herramientas de selección de transacciones. Sin embargo, no se considera que tenga el equity research más sólido y las capacidades de depuración de datos son buenas, pero no están al nivel de S&P, según Wall Street Prep.
DataMinr
DataMinr es una plataforma de IA en tiempo real que utiliza datos públicos para detectar señales de eventos de gran impacto. Por ejemplo, DataMinr proporciona datos de Twitter en tiempo real que pueden analizarse para apoyar las operaciones, conocer el mercado, asesorar a los clientes y generar tesis de inversión.
FinBERT
FinBERT se basa en un modelo de representación del lenguaje que se desarrolló originalmente para la minería de textos biomédicos, y se ha desarrollado para el sector de los servicios financieros. FinBERT opera con un conjunto de datos que contiene noticias financieras de Reuters y asigna el sentimiento utilizando un banco de frases. Aparte del costo de utilizar Reuters, es gratuito, pero requiere conocimientos de lenguaje de programación para su uso. Para más información, consulte esta página de Github.
Wordstat
Provalis Research tiene una herramienta de minería de texto llamada Wordstat. No es necesariamente para datos financieros, pero puede usarse para eso. Tiene integraciones en python para búsquedas aún más específicas, incluyendo la construcción de diccionarios, mapas, etc.
Resultados de GBM México
GBM utilizó herramientas de ciencia de datos (no especificadas) para analizar texto como datos en su reciente informe Top of Mind: Text Analysis from 3Q21 Earning Calls in Mexico and the World. Examinaron las conferencias de resultados trimestrales de México (más de 400) y de empresas mundiales (más de 22,700) para identificar temas comunes según la frecuencia de uso palabras o frases.
En México, hubo una tendencia positiva en el vocabulario de las empresas. Las menciones a la “cadena de suministro”, al igual que a las “materias primas”, tuvieron los mayores incrementos y fueron dominantes en las llamadas de resultados, lo que también se observó con las empresas globales. El crecimiento también fue ampliamente mencionado, lo que es una señal positiva en las empresas mexicanas.
En cuanto al sentimiento en México, la proporción de pares de palabras negativas ha seguido disminuyendo desde el 1T20, mientras que la lista de palabras positivas se ha mantenido estable. En el 3T21, el 2.7% de las palabras monitoreadas fueron positivas y el 1.6% fueron negativas, en comparación con el 1T20 (1.7% positivas, 7.0% negativas). Arca Continental (AC) tuvo el mayor número de menciones positivas en su llamada de resultados del 3T21.
Otras conclusiones interesantes del informe fueron:
- Los temas de ESG y transformación digital siguen en aumento en la narrativa corporativa mexicana, una tendencia que ha sido consistente en los últimos tres años.
- En comparación con los informes globales, México tuvo menos menciones sobre “trabajo”, ya que es un tema menos importante que en los Estados Unidos.
- Pandemia – Las menciones a la pandemia tuvieron un descenso trimestre contra trimestre de 2 puntos porcentuales.
- Crecimiento – AC, KOF, WALMEX, CEMEX y GCC tuvieron las mayores menciones sobre crecimiento.
- Cadena de suministro – Las siguientes empresas tuvieron el mayor número de menciones CUERVO (37), NEMAK (21), ORBIA (20) y KIMBER (18). Las palabras relacionadas con el suministro subieron al 7.9% en el 3T21, frente al 4.5% en el 2T21 y el 2.3% en el 3T20.
- Precios – Los precios/inflación fueron relevantes este trimestre, con un aumento de 2 puntos porcentuales. CEMEX tuvo la mayor exposición, seguida de KIMBER, AC y ALFA.
- Costos – CEMEX tuvo la mayor exposición, sobre todo por los “costos de los insumos”, seguida de KIMBER, ORBIA (“aumentos de costos”) y FIHO (“control de costos” y “reducción de costos”).
- ESG – Las menciones de CEMEX a los “combustibles alternativos” le dieron la mayor exposición, seguida de KOF (sostenibilidad), y GCC.
- Digital – GFNORTE tuvo la mayor cantidad de menciones sobre el crecimiento digital, seguido por TLEVISA y GENTERA.
En Miranda IR estamos felices de ayudar a su empresa con la preparación del análisis de sentimiento para las llamadas de resultados; nosotros utilizamos varias de las herramientas mencionadas en este blog.
Fuentes
- https://gbmenlinea.gbm.com.mx/Documentosanalisis/dss_top_of_mind_3q21.pdf
- https://www.stevens.edu/sites/stevens_edu/files/Machine%20Reading%2020210311.pdf
- https://insight.factset.com/highest-number-of-sp-500-companies-citing-inflation-on-q2-earnings-calls-in-over-10-years
- https://provalisresearch.com/products/content-analysis-software/
- https://www.wallstreetprep.com/knowledge/bloomberg-vs-capital-iq-vs-factset-vs-thomson-reuters-eikon/
- https://gbmenlinea.gbm.com.mx/Documentosanalisis/dss_top_of_mind_3q21.pdf
- https://sonix.ai/articles/difference-between-artificial-intelligence-machine-learning-and-natural-language-processing
- https://www.avenga.com/magazine/nlp-finance-applications/
- https://www.bloomberg.com/professional/sentiment-analysis-white-papers/
- https://www.bloomberg.com/professional/blog/trading-news-use-machine-readable-data-find-alpha/
Contactos en Miranda Partners
Damian Fraser
Miranda Partners
damian.fraser@miranda-partners.com
Ana María Ybarra Corcuera
Miranda-IR
ana.ybarra@miranda-ir.com