AutoML Tables — это мощный инструмент машинного обучения, предоставляемый Google Cloud, который позволяет пользователям создавать и развертывать модели машинного обучения без необходимости обширных знаний в области программирования или обработки данных. Он автоматизирует процесс проектирования функций, выбора модели, настройки гиперпараметров и оценки модели, делая его доступным для пользователей с разным уровнем знаний в области машинного обучения.
Что касается типов данных, таблицы AutoML могут обрабатывать широкий спектр структурированных типов данных. Структурированные данные относятся к данным, которые организованы в табличном формате, где строки представляют экземпляры или примеры, а столбцы представляют функции или переменные. Таблицы AutoML могут обрабатывать как числовые, так и категориальные типы данных, что позволяет пользователям работать с разнообразными наборами данных.
1. Числовые данные. Таблицы AutoML поддерживают различные типы числовых данных, включая целые числа и числа с плавающей запятой. Эти типы данных подходят для представления непрерывных или дискретных числовых значений. Например, если у нас есть набор данных о ценах на жилье, столбец цен будет представлен числовым типом данных.
2. Категориальные данные. Таблицы AutoML также поддерживают категориальные типы данных, которые представляют дискретные значения, попадающие в определенные категории. Категориальные данные можно разделить на два подтипа:
а. Номинальные данные: Номинальные данные представляют категории, которые не имеют внутреннего порядка или иерархии. Например, если у нас есть набор данных отзывов клиентов, в столбце настроений могут быть такие категории, как «положительные», «нейтральные» и «отрицательные». Таблицы AutoML могут обрабатывать такие номинальные категориальные данные.
б. Порядковые данные. Порядковые данные представляют категории, имеющие определенный порядок или иерархию. Например, если у нас есть набор данных рейтингов фильмов, в столбце оценок могут быть такие категории, как «плохо», «удовлетворительно», «хорошо» и «отлично». Таблицы AutoML могут обрабатывать такие порядковые категориальные данные и учитывать порядок категорий во время обучения модели.
3. Текстовые данные. Таблицы AutoML также поддерживают текстовые данные. Текстовые данные обычно неструктурированы и требуют предварительной обработки для преобразования в структурированный формат, подходящий для машинного обучения. Таблицы AutoML могут обрабатывать текстовые данные, используя такие методы, как встраивание текста или представление набора слов. Например, если у нас есть набор данных отзывов клиентов, текст отзыва можно преобразовать в числовые характеристики с помощью таких методов, как встраивание слов, которые затем могут использоваться таблицами AutoML для обучения модели.
4. Данные временных рядов. Таблицы AutoML могут обрабатывать данные временных рядов, то есть данные, собранные за последовательность временных интервалов. Данные временных рядов обычно встречаются в различных областях, таких как финансы, прогнозирование погоды и анализ фондового рынка. Таблицы AutoML могут обрабатывать данные временных рядов, включая функции, связанные со временем, такие как временные метки и запаздывающие переменные.
Таблицы AutoML могут обрабатывать широкий спектр структурированных типов данных, включая числовые, категориальные (как номинальные, так и порядковые), текстовые данные и данные временных рядов. Эта универсальность позволяет пользователям использовать возможности таблиц AutoML для разнообразного набора задач машинного обучения в различных областях.
Другие недавние вопросы и ответы, касающиеся Таблицы AutoML:
- Почему таблицы AutoML были прекращены и что пришло им на смену?
- Как пользователи могут развернуть свою модель и получить прогнозы в таблицах AutoML?
- Какие параметры доступны для настройки бюджета обучения в таблицах AutoML?
- Какую информацию предоставляет вкладка «Анализ» в таблицах AutoML?
- Как пользователи могут импортировать свои обучающие данные в таблицы AutoML?