Prasówka IT SALESmanago to zbiór nowości, ciekawostek i rozwiązań z zakresu programowania, Big Data, Machine Learning & AI oraz budowania zaawansowanych systemów informatycznych.
Co dwa tygodnie nasi specjaliści selekcjonują kilka najważniejszych i najciekawszych artykułów. W tym wydaniu m.in. retusz zdjęć za pomocą Deep Learning, najpopularniejsze biblioteki dla języka Java i anonimizacja danych z PostgreSQL.

 

 

Machine Learning & AI

Deep Learning sprawi, że twoje zdjęcia staną się piękne

Jeśli na twoich wakacjach było zbyt mało słońca a zdjęcia wyszły nieostre, to dzięki pomocy Deep Learningu możesz je w łatwy sposób automatycznie poprawić. W artykule przykład jak z pomocą TensorFlow, NumPy i SciPy sprawić, żeby zdjęcia nabrały bardziej profesjonalnego wyglądu.

https://towardsdatascience.com/make-your-pictures-beautiful-with-a-touch-of-machine-learning-magic-31672daa3032

 

Analiza sentymentu przy pomocy AI

Analiza sentymentu to nie tylko detekcja tematu wypowiedzi, ale również bardzo szerokie zagadnienie pozwalające zidentyfikować emocje kryjące się za tekstem – nazywa się to również eksploracją opinii (opinion mining) lub emotion AI.

Bardzo często sentyment danego słowa kryje się w kontekście danego zdania lub całego tekstu. Jak to rozpoznawać? Jakich narzędzi użyć?

Dowiesz się tego z poniższego artykułu:

https://www.infoq.com/articles/sentiment-analysis-whats-with-the-tone

 

Programowanie Ogólne

API – najważniejsze elementy na podstawie 100 wdrożonych projektów

Interfejsy API służą do komunikacji pomiędzy dwoma systemami – najczęściej jest to wywołanie zdalnych serwisów. W jaki sposób tworzyć API, aby były wydajne, szybkie i bezpieczne? Najlepsze porady znajdziesz w poniższym artykule:

https://nordicapis.com/key-lessons-from-100-api-projects/

 

Top 100 bibliotek dla języka Java

Od kilku lat pozycja języka Java w technologiach programowania konsekwentnie się wzmacnia. Na podstawie ponad 270 tysięcy przeanalizowanych plików źródłowych wybranych zostało Top 100 najpopularniejszych bibliotek dla Javy:

https://blog.overops.com/the-top-100-java-libraries-in-2018-based-on-277975-source-files/

 

Bazy danych & Big Data

Load Balancing i Connection Pooling przy pomocy PgPool-II

Load Balancing to bardzo ważne zagadnienie w kontekście wzrastającego ruchu w Twojej aplikacji. Często w tym przypadku wąskim gardłem okazują się zasoby bazodanowe – w poniższym artykule dowiesz się jak równoważyć obciążenie i rozłożyć je na kilka maszyn bazodanowych przy użyciu PgPool-II.

https://hackernoon.com/postgresql-connection-pooling-and-load-balancing-with-pgpool-ii-cluster-edbbb7959ef1

 

Anonimizacja danych – jak to zrobić z PostgreSQL?

Temat anonimizacji danych zwykle jest bardzo szerokim i wymagającym zagadnieniem, z którym w kontekście przepisów GDPR zmaga się wiele organizacji. Na szczęście PostgreSQL posiada wiele mechanizmów, aby sprostać tym wymaganiom. W poniższym artykule znajdziesz przegląd i sposób implementacji poszczególnych strategii anonimizacji:

http://blog.taadeem.net///english/2019/01/03/8_anonymization_strategies_with_postgres

 

Apache Kafka – najlepsze praktyki do optymalizacji deploymentu

Swoją popularność w projektach Big Data Apache Kafka zawdzięcza między innymi szybkiej i wygodnej implementacji oraz możliwości działania w klastrach składających się z relatywnie tanich maszyn. Jednak wdrożenie tego typu rozwiązań na środowisko to nie koniec pracy – działające elementy należy monitorować i tuningować. W jaki sposób zapewnić poprawność działania, wysoką wydajność i spokojny sen?

https://www.infoq.com/articles/apache-kafka-best-practices-to-optimize-your-deployment

 

Monitoring aplikacji Apache Spark przy użyciu InfluxDB i Grafany

Apache Spark stał się niezwykle popularną technologią wykorzystywaną w firmach pracujących z projektami Big Data. Spark oferuje wiele ciekawych mechanizmów równoległej analizy i przetwarzania danych – zarówno w czasie rzeczywistym, jak i w sposób batchowy.

Aby zapewnić niezawodność takiego rozwiązania, potrzebny jest dobry monitoring infrastruktury – dobrze do tego nadają się rozwiązania InfluxDB oraz Grafana:

https://www.infoq.com/articles/spark-application-monitoring-influxdb-grafana

 

Frontend

Webpack – od podstaw do testów automatycznych

Wśród frontendowców można usłyszeć następujący żart – jeśli danego dnia nie powstał żaden nowy framework do JavaScriptu – jest to dzień stracony. Sama technologia i cały ekosystem wokół JavaScript nieustannie się zmienia. W poniższym artykule dowiesz się jak to wszystko połączyć.

https://itnext.io/webpack-from-0-to-automated-testing-4634844d5c3c

 

Wydajność Frontendu – checklista na 2019

Ocena wydajności działania Frontendu i wskazanie wąskich gardeł jest procesem skomplikowanym – może to być ciężki kod JavaScript, powolne ładowanie zewnętrznych zasobów lub choćby ciężkie obrazki. Wydajność powinna być stale mierzona, monitorowana i udoskonalana. Na szczęście w 2019 roku istnieje już wiele zbiorów dobrych praktyk w tym temacie:

https://www.smashingmagazine.com/2019/01/front-end-performance-checklist-2019-pdf-pages/