Wstępne przetwarzanie danych
Redukcja liczby cech
W przypadku danych, których rozmiar jest znaczny, istotnym krokiem przetwarzania wstępnego jest ograniczenie liczby cech (kolumn) przekazywanych do eksploracji. Zadanie to nosi nazwę redukcji liczby cech i może być wykonane w dwojaki sposób. Pierwszy z nich, zwany selekcją cech, polega na eliminacji nadmiarowych, mało istotnych cech (tzw. cech redundantnych). Drugi zaś, zwany ekstrakcją cech, polega na agregacji cech w mniej liczny zbiór nowych cech.
W pierwszym przypadku poszukiwany jest minimalny zbiór oryginalnych cech reprezentujący wyjściowy zbiór danych w możliwie najwierniejszy sposób. W praktyce oznacza to poszukiwanie pewnego podzbioru cech. Jako że dla n cech całkowita liczba możliwych ich podzbiorów wynosi 2n, przeszukiwanie wyczerpujące jest zwykle mało efektywne, a czasem wręcz niemożliwe. Dlatego stosuje się metody heurystyczne, bazujące m.in. na miarach prawdopodobieństwa (np. analiza kowariancji, korelacji), miarach ilości informacji (wyrażanej m.in. entropią) czy z wykorzystaniem metod inteligencji obliczeniowej, takich jak np. algorytmy genetyczne czy drzewa decyzyjne.
W przypadku ekstrakcji zbiór analizowanych cech jest ograniczany poprzez tworzenie nowych cech będących kombinacją cech wyjściowych. Na przykład zamiast używać dwóch cech takich jak długość i szerokość można wprowadzić nową cechę – pole powierzchni, będącą ich kombinacją, w tym przypadku iloczynem z wagami równymi 1. Nie zawsze jednak jesteśmy w stanie utworzyć cechy mające – tak jak w powyższym przykładzie – interpretację. Niemniej jednak zasada jest podobna. W tym zakresie najbardziej popularnymi metodami są analiza składowych głównych PCA (Principal Component Analysis) oraz analiza czynnikowa. Zwykle jednak cechy te nie mają interpretacji, a wybór sposobu redukcji liczby cech może być podyktowany niekiedy właśnie taką koniecznością.
Redukcja liczby cech, często oprócz usunięcia cech nieniosących istotnych informacji i zmniejszenia złożoności obliczeniowej algorytmów eksploracji, ma jeszcze kilka innych zalet. Ułatwia między innymi zrozumienie wyników ostatecznej analizy oraz zapobiega nadmiernemu dopasowaniu opracowanych modeli do danych.
Mogą zainteresować Cię również

Technologia goni pracowników. Chcą wiedzieć więcej o AI, a firmy nie nadążają z edukacją.
Zaledwie 9% pracowników deklaruje, że nie wie, czym są automatyzacja i sztuczna inteligencja. 46,7% natomiast przyznaje, że chciałoby pogłębić swoją wiedzę w tym zakresie. Rosnące zainteresowanie technologiami idzie w parze z obawami. Od lęku przed brakiem kompetencji, przez ...
Redukcja hałasu w przemyśle – wyzwanie wymagające kompleksowych działań
Hałas w zakładach przemysłowych pozostaje jednym z głównych czynników wpływających zarówno na komfort pracy, jak i na relacje zakładów z otoczeniem. Utrzymanie jego poziomu w akceptowalnych granicach to nie tylko wymóg prawny. Jest to przede wszystkim element budowania kultury...

Wrzesień pełen przemysłowych premier: FASTECH Expo i Aluminium Tech Expo 2025 w Ptak Warsaw Expo
Wrzesień 2025 roku zapowiada się jako miesiąc przełomowych wydarzeń dla branży przemysłowej w Polsce. Ptak Warsaw Expo w Nadarzynie stanie się areną dwóch kluczowych targów: FASTECH Expo oraz Aluminium Tech Expo. Targi te, choć odbywają się w różnych terminach, oferują unikaln...
Analiza wpływu modyfikacji geometrii na pasowanie połączeń wielowypustowych wytwarzanych z zastosowaniem metody FFF
Dokładność geometryczna jest jednym z fundamentalnych kwalifikatorów poprawności procesów wytwarzania części maszyn i urządzeń. Jest ona wynikiem wielu składowych, stanowiących o całościowym efekcie procesu produkcyjnego. W celu zape...

Rynek magazynowy mniej spektakularny, ale bardziej przewidywalny. Dobre wieści dla sektora outsourcingu procesowego
Pierwszy kwartał 2025 roku potwierdził, że polski rynek powierzchni magazynowo – przemysłowych, mimo braku rekordowych wyników, pozostaje stabilny i dojrzewa operacyjnie. Według danych AXI IMMO oraz CBRE, całkowity popyt na te powierzchnie przekroczył 1,1 mln mkw., co oznacza ...
Jakość procesu cięcia laserowego blach stalowych – wpływ zawartości krzemu i innych pierwiastków stopowych
Przeprowadzono analizę czynników i parametrów decydujących o jakości procesu cięcia laserowego. Zestawiono blachy stalowe o gwarantowanej przez producentów jakości cięcia laserowego laser grade steels. Opisano wpływ zawartości krzemu i innych pierwiastków stopowy...

Metody i techniki eliminacji wad w procesie tłoczenia
Procesy kształtowania blach stalowych za pomocą obróbki plastycznej są jedną z wielu technik wytwarzania elementów metalowych stosowanych w przemyśle od lat, a mimo to wymagających rozwiązań niektórych problemów technologicznych pojawiających się przy kształtowaniu blach stalo...

Wpływ chłodziwa i oprawki narzędziowej na chropowatość powierzchni obrabianej w procesie frezowania stali Vanadis 4
Artykuł prezentuje wyniki badań eksperymentalnych procesu frezowania stali Vanadis 4 Extra w rożnych warunkach doprowadzenia chłodziwa do strefy obróbki oraz pokazuje, jak ważny jest dobór odpowiedniej oprawki narzędziowej do określonych zadań obróbkowych. ...

Technologia goni pracowników. Chcą wiedzieć więcej o AI, a firmy nie nadążają z edukacją.
Zaledwie 9% pracowników deklaruje, że nie wie, czym są automatyzacja i sztuczna inteligencja. 46,7% natomiast przyznaje, że chciałoby pogłębić swoją wiedzę w tym zakresie. Rosnące zainteresowanie technologiami idzie w parze z obawami. Od lęku przed brakiem kompetencji, przez ...

Wybrane problemy stateczności w projektowaniu konstrukcji według Eurokodów
Zagadnienia stateczności konstrukcji budowlanych stanowią jeden z trudniejszych działów mechaniki budowli, z którym projektanci konstrukcji zmagają się na co dzień. Niezależnie od tego, czy projektujemy klasyczną drewnianą więźbę dachową, stalową belkę podsuwnicową, czy też sł...

Jak zminimalizować ryzyko awarii wycinarki laserowej?
Aby zminimalizować ryzyko awarii wycinarki laserowej, warto stosować się do kilku dobrych praktyk, które obejmują zarówno szkolenie operatorów, jak i odpowiednią konserwację oraz kontrolę parametrów urządzenia.
Fizyczne i technologiczne podstawy procesu spawania łukowego w osłonie gazowej GMA – cz. 2
W drugiej części artykułu przedstawiono technologiczne podstawy spawania GMA. Z artykułu dowiesz się:

Bezpieczeństwo maszyn. Analiza ryzyka w oparciu o normę PN-EN ISO 12100:2012
Maszyny dopuszczone do użytku na terenie Unii Europejskiej muszą spełniać wymagania tzw. dyrektywy maszynowej. Jednym z warunków jej spełnienia, umożliwiającym oznakowanie maszyny znakiem CE, jest wykonanie analizy ryzyka. Maszyny wp...

Znamy laureatów nagrody Złoty Medal targów MODERNLOG 2024
Poznaliśmy produkty wyróżnione prestiżową nagrodą Złotego Medalu na targach Logistyki, Magazynowania i Transportu MODERNLOG 2024 oraz ITM INDUSTRY EUROPE 2024. Laureaci zawalczą teraz o Złoty Medal Wybór Konsumentów. W minionym tygod...
IGP-DURA®one 56 i IGP-Effectives®: synergia zapewniająca wysoką wydajność w technologii malowania proszkowego
W branży farb proszkowych do ochrony powierzchni kluczowe znaczenie mają wydajność, zrównoważony rozwój i jednolity odcień. Firma IGP Powder Coatings podjęła znaczący krok w tym kierunku, łącząc serię niskotemperaturowych farb proszkowych IGP-DURA®one56 z unikalną technologią ...

JPK CIT. Nowe obowiązki raportowania
Od 1 stycznia 2025 roku zaczął obowiązywać nowy, jednolity standard raportowania podatkowego dla przedsiębiorstw objętych podatkiem dochodowym od osób prawnych, tzw. JPK CIT. Nowe regulacje w pierwszym roku obejmują największe f...
Kalendarium wydarzeń
Relacje
OpenHouse 2024: z wizytą u TRUMPF Polska
TRUMPF Polska z sukcesem zorganizowała Dni Otwarte OpenHouse 2024, które odbyły się 12 i 13 września br. Wydarzenie przyciągnęło ponad 200 gości reprezentują...
Sprawdź więcejPolitechnika Krakowska ma nowe laboratorium
25 kwietnia na Wydziale Mechanicznym Politechniki Krakowskiej odbyło się uroczyste otwarcie Laboratorium Ultraprecyzyjnych Pomiarów Współrzędnościowych. &...
Sprawdź więcejSeminarium Obróbki Laserowej 22 marca 2024
22 marca 2024, podczas targów STOM, odbyło się Seminarium Obróbki Laserowej, organizowane przez Politechnikę Świętokrzyską. Zapraszamy do zapoznania się z fo...
Sprawdź więcejKonferencja „Stal, Metale, Nowe Technologie”
20 marca, drugiego dnia targów STOM, odbyła się konferencja „Stal, Metale, Nowe Technologie”, której organizatorem była redakcja portalu dlaprodukcji.pl i dw...
Sprawdź więcej