Як стандартизувати дані в Python?

admin | 4 Квітня, 2025


У Python ви можете використовувати sklearn. модуль попередньої обробки для нормалізації та стандартизації числових даних. Наприклад, клас MinMaxScaler можна використовувати для нормалізації стовпця даних, а клас StandardScaler — для його стандартизації. 12 вересня 2023 р.

Бібліотека Python sklearn пропонує нам з Функція StandardScaler(). стандартизувати значення даних у стандартному форматі. Відповідно до наведеного вище синтаксису ми спочатку створюємо об’єкт функції StandardScaler(). Крім того, ми використовуємо fit_transform() разом із призначеним об’єктом, щоб трансформувати дані та стандартизувати їх.

Стандартизація даних досягається за допомогою таких методів:

  1. Регулювання масштабу. Забезпечення узгодженості числових даних. …
  2. Категорична послідовність. Забезпечення узгодженого найменування або маркування категорій. …
  3. Форматування дати. Переконайтеся, що значення дати дотримуються узгодженого формату. …
  4. Обробка нульового значення.

Стандартизуйте функції, видаливши середнє значення та масштабуючи дисперсію одиниць. де u — середнє значення навчальних вибірок або нуль, якщо with_mean=False, а s — стандартне відхилення навчальних вибірок або одиниця, якщо with_std=False.

Як нормалізувати дані в Python?

  1. з попередньої обробки імпорту sklearn.
  2. імпортувати numpy як np.
  3. x_масив = np. масив ([2,3,5,6,7,4,8,7,6])
  4. normalized_arr = попередня обробка. normalize([x_array])
  5. print(normalized_arr)

Використовуючи Python і NumPy, ми обчислити мінімальне та максимальне значення масиву та застосувати формулу (масив – min) / (max – min) нормалізувати дані. Цей процес дозволяє стандартизувати набір даних, полегшуючи визначення тенденцій і викидів.