ПредишенСледващото

un1t. Тази процедура може да се направи по различни начини. Най-лесният вариант - да се изважда средната и разделете на разликата между максималната стойност и минимално. Но това е лошо, защото в случай на аварийно изпускане (например, първата променлива точка дойде със стойност 1000) този тип лечение не е успешно.
Втори пример - изваждане на средната стойност и е разделен на стандартното отклонение. Този метод е по-устойчива към големите различия в стойностите. Но все пак средната и стандартното отклонение са чувствителни към големите различия в стойностите.
Трети пример (стабилна нормализиране) - вземете медианата и да си поделят разликата между третото и първите квартилите. Такова изпълнение по същество обезсилва ефекта на емисиите.

Бих искал да се коригира малко. На метрични методи, както е отбелязано по-горе, предлага да се нормализират (за получаване на диапазон [0; 1]), които правят едно и също принос.
Линейните модели (това включва SVM) функции трябва да се стандартизира (изваждане на средната стойност и разделят от стандартното отклонение на средната стойност е нула и стандартното отклонение единици). Защото:
Един от най-важните предположението, когато се занимават с линейни модели, чиито параметри се оценяват от най-малките квадрати, е, че остатъци модел независим (т.е., несвързани помежду си) и имат нормално разпределение със средна стойност 0 и някои фиксирани стандартно отклонение σεσε, т например гости-. ε_i ~ N (0, σ).
Диагностика на линейни регресионни модели. част 1

Подкрепете проекта - споделете линка, благодаря!