Microsoft создала ИИ, который облегчит работу с таблицами в Excel
Это решение позволяет анализировать и интерпретировать данные в таблицах, решая большинство связанных с ними задач. Для этого используется процесс сериализации данных, включающий адреса, значения и форматы ячеек.
SpreadsheetLLM включает компонент SheetCompressor, который сжимает электронные таблицы перед передачей их модели ИИ. Этот компонент состоит из трех модулей: первый анализирует структуру таблицы и удаляет ненужное содержимое, второй преобразует данные в более эффективное представление, а третий агрегирует данные.
Однако у SpreadsheetLLM есть некоторые ограничения. Она не учитывает цвета ячеек, которые могут иметь определенное значение, и не осуществляет семантическое сжатие для содержимого ячеек, выраженного естественным языком. Тем не менее, эти ограничения позволяют сократить потребление токенов при запросе к ИИ на 96%, что экономит вычислительные ресурсы.
Основная цель проекта – не заменить человека, а помочь ему в финансовых, бухгалтерских и других задачах, связанных с обработкой данных. Модель включает фреймворк Chain of Spreadsheet (CoS) для анализа содержимого нескольких таблиц. SpreadsheetLLM может работать как со структурированными, так и с неструктурированными данными электронных таблиц, что помогает уменьшить вероятность "галлюцинаций" в ответах ИИ.
В настоящее время проект находится на стадии исследования, и пока не готов к коммерческому использованию.