Публикации по теме 'pandas'
Понимание регрессоров дерева решений: создание пользовательской реализации на Python
Введение
Регрессоры деревьев решений — это мощные, универсальные и простые для понимания модели машинного обучения, используемые для решения задач регрессии. В задачах регрессии цель состоит в том, чтобы предсказать непрерывную целевую переменную на основе входных признаков. Регрессоры дерева решений строят древовидную структуру, рекурсивно разбивая входные данные на подмножества, оптимизируя разделение на основе значений входных признаков. Конечным результатом является иерархическая..
Выполнять очень простые операции Pandas с данными
В этом руководстве вы познакомитесь с самыми основными операциями, выполняемыми с данными с помощью pandas.
Специалисты по обработке данных тратят много времени на очистку наборов данных и приведение их в форму, с которой они могут работать. Фактически, многие специалисты по данным утверждают, что начальные шаги по получению и очистке данных составляют 80% работы.
Таким образом, если вы только входите в это поле, важно иметь возможность иметь дело с беспорядочными данными, что..
Начало пути по науке о данных (часть 2): Pandas DataFrame
В части 1 мы начали идти по этой дороге и по пути встретили Series.
Начало пути по науке о данных (часть 1): серия Pandas Теперь, когда мы сделали первый шаг в науке о данных, переходим кdatascience.com
Но наши исследования еще не закончены. В этой части мы рассмотрим другой объект pandas - DataFrame. Сначала мы решим ту же проблему индекса массы тела, которую мы видели в серии, а затем перейдем к более сложной задаче...
Серия Pandas: от новичка до профессионала — Часть 01
Создание и преобразование типов данных серии Pandas
Серия — это одномерная индексированная структура данных, используемая для хранения данных любого типа (целое число, число с плавающей запятой, строка, объект, логическое значение и т. д.). Это похоже на столбец листа данных Excel. Серия является краеугольным камнем фрейма данных панд, который представляет собой двумерную структуру данных, используемую для хранения плоского файла, такого как лист Excel. В этой статье мы рассмотрим..
Pandas Query — Динамическая фильтрация данных
Что делать, если критерии фильтрации слишком сильно меняются?
У Pandas есть простые в использовании инструменты для фильтрации ваших DataFrames, однако базовые методы, такие как loc, iloc или передача логического выражения, не позволяют удобно использовать их, когда параметры фильтрации не являются статическими. Метод query DataFrame предлагает решение этой проблемы.
В этой статье я буду использовать Набор данных IBM HR Analytics о сокращении и производительности сотрудников от..
Leetcode 1757. Перерабатываемые продукты с низким содержанием жира (панды)
Напишите решение, позволяющее найти идентификаторы продуктов с низким содержанием жира и пригодных для вторичной переработки.
Верните таблицу результатов в любом порядке .
Формат результата представлен в следующем примере.
Код:
импортировать панд как pd
def find_products(products: pd.DataFrame) -> pd.DataFrame:
# Отфильтруйте входной DataFrame, чтобы выбрать строки, в которых как low_fats, так и recyclable имеют значение «Y».
результат = продукты[(продукты['low_fats'] ==..
Введение в понимание списка Python с Pandas
Что такое понимание списка?
Понимание списков — это мощный инструмент в Python, с помощью которого мы можем невероятно лаконичным образом составлять списки из других итерируемых объектов с применением сложной логики, если это необходимо. К счастью для нас, этот инструмент можно очень хорошо использовать и в наших проектах данных, поскольку большую часть времени одним из основных строительных блоков объектов серии Pandas являются массивы NumPy.
Теперь очень важно понять, что массивы,..