174 links
  • Bwatt's links
  • Home
  • Login
  • RSS Feed
  • Tag cloud
  • Picture wall
  • Daily
Links per page: 20 50 100
◄Older
page 1 / 2
  • Data’s Inferno: 7 Circles of Data Testing Hell with Airflow
    Comment pouvoir tester efficacement ses pipelines airflow. Pas mal de choses et d'aspect intéressant, et dont je compte bien m'inspirer, travaillant actuellement intensément sur Airflow
    Tue Jun 5 13:47:43 2018 - permalink -
    QR-Code
    - https://medium.com/@ingwbaa/datas-inferno-7-circles-of-data-testing-hell-with-airflow-cef4adff58d8?mkt_tok=eyJpIjoiTkRoalptTm1NbVJpWmpBNCIsInQiOiJUZUZTQU5XaGJpbUFWTjBRbkFwYjNPK2JMWWFUUFJjQWtpS2owNXBYZjhydUoxbXNyMkdIMnhMUkFsNFk0NDcyRDVHSlJhZnd6UmJNZ2RnSG42OW1OcldicXVqV3NhdTNuemEzcm00bkh0NzJpaG91VVVKMmZ5NXc1SmdDb20zUiJ9
    airflow big-data data-engineer
  • Catégorie : algorithme génétique - Xavier Nayrac
    Sèrie d'articles sur les algorithmes génétiques (fait de générer des solutions à un problème, puis croiser les meilleures d'entre elles pour arriver à une solution qui, après plusieurs générations, se rapproche de l'optimum (car oui on utilise ca en général pour des problèmes NP-complexe où la calcul de la solution optimale prendrait trop de temp)). Ne pas avoir peur du nombre d'articles, chacun d'entre eux décrit une étape de l'algorithme. Assez intéressant pour comprendre ce que c'est.
    Mon Mar 12 16:46:44 2018 - permalink -
    QR-Code
    - http://lkdjiin.github.io/blog/categories/algorithme-genetique/
    algorithme concept
  • Pour Noël, je comprends mon noyau GNU/Linux ! | Blog Eleven Labs
    Série d'articles expliquant comment compiler soi-même son noyau linux (en désactivant plein de drivers inutiles au passage pour booter plus vite). Bien que ça faille peur de base, ça a pas l'air si compliqué. Faut que je test un de ces 4.
    Fri Feb 16 17:25:43 2018 - permalink -
    QR-Code
    - https://blog.eleven-labs.com/fr/comprendre-kernel-linux/
    a-tester linux
  • Hackez votre supermarché : Voici 11 fruits et légumes que vous ne devriez acheter qu'une seule fois dans votre vie, si vous connaissez ces astuces !
    Astuces pour refaire pousser des légumes à partir de vos déchets. Une pratique que je fais depuis fort longtemps (à un moment, étudiant, j'avais un oignon et une patate qui poussait en même temps). Actuellement, j'en suis à une carotte et un avocat. À suivre !
    Wed Feb 14 22:13:00 2018 - permalink -
    QR-Code
    - https://www.demotivateur.fr/article-buzz/11-fruits-et-legumes-que-vous-ne-devriez-acheter-qu-une-seule-fois-dans-votre-vie-si-vous-apprenez-ces-petits-trucs-pour-les-regenerer-chez-vous--2972
    diy
  • Kitchen Soap – On Being A Senior Engineer
    Une bonne description des qualités qu'il faut pour l'auteru pour etre un senior engineer. Où il montre qu'on n'a pas uniquement besoin de techniques, mais surtout de maturité. Et cette maturité passe par la faculté de travailler en harmonie avec les autres (accepter les critiques, rester ouvert à tout le monde et pas seulement à l'IT...).
    Tue Feb 6 15:52:56 2018 - permalink -
    QR-Code
    - https://www.kitchensoap.com/2012/10/25/on-being-a-senior-engineer/
    bonnes-pratiques english informatique
  • Premiers pas avec Terraform - Zwindler's Reflection
    Introduction à l'outil terraform, dédié à l'abstraction de la construction d'une infrastructure sur différents cloud provider. Faut vraiment que je teste un de ces quatre (promis Crichon)
    Wed Jan 24 18:35:23 2018 - permalink -
    QR-Code
    - https://blog.zwindler.fr/2018/01/16/premiers-pas-avec-terraform/
    a-tester devops outil
  • AdminRezo » La sécurité avec Docker – Chapitre 1 : Le système
    Série d'articles sur la sécurité avec docker
    Wed Jan 24 18:26:19 2018 - permalink -
    QR-Code
    - https://blog.adminrezo.fr/2017/12/la-securite-avec-docker-et-les-containers-chapitre-1-le-systeme/
    docker sécurité
  • Do Things that Don't Scale
    Un article décrivant les bonnes pratiques à suivre quand on lance une start-up (spécifiquement une start-up développant un produit informatique B2C). Il peut se résumer en ceci : pensez uniquement à l'instant présent en recrutant un maximum d'utilisateurs et en satisfaisant le moindre de leurs besoins. D'où le titre de l'article : il n'est effectivement pas utile de trop prévoir (et donc de scale up), mieux vaut voir petit. Si vouy avez à scaler, vous verrez en temps utile (et ce sera un bon problème pour vous).
    Ca me fait pas mal penser au développement informatique, où une des règles d'or pour moir est : pas de pré-optimisation. Faites un truc petit, mais qui marche bien. Ainsi vous pourrez convaincre rapidement un client. L'optimisation viendra après, si nécessaire, quand vous aurez mieux cerner les besoins nécessaires (car pour moi 90% de la pré-optimisation est ensuite à jetter, car basé sur les besoins supposés du client, tels que vu dans le cahier des charges, et non sur ses besoins réels, qui se voient à l'usage).
    Mon Jan 22 11:09:02 2018 - permalink -
    QR-Code
    - http://paulgraham.com/ds.html
    bonnes-pratiques english informatique
  • Préparez-vous au RGPD en 12 points-clés - Open-Freax
    RGPD (ou GDPR en anglais) arrive. Cette nouvelle loi européenne sur la protection des données arrive, et plein d'entreprises essaient de se mettre à jour. Cet article explique comment bien s'y préparer en 12 points.
    Wed Jan 10 08:08:37 2018 - permalink -
    QR-Code
    - https://open-freax.fr/rgpd-12-mots-cles/
    données régulation
  • Joel on Software
    Un autre excellent blog sur les manières de travailler en informatique (très souvent cité par Codeahoy, le précédent blog shaarlié) mais aussi avec quelques pans plus techniques, écrits par l'un des deux fondateurs de stackoverflow. Un de ses meilleurs articles porte notamment sur 'The Joel test' (https://www.joelonsoftware.com/2000/08/09/the-joel-test-12-steps-to-better-code/), un test établi afin de trouver les entreprises qui ont selon lui la meilleure culture informatique (les entreprises qui postent des offres sur Stackoverflow doivent notamment y passer). À lire absolument pour avoir une idée du bonhomme (surtout vu que l'erticle renvoie vers pleeeeeeeeeeeeins d'autres articles intéressants).
    Mon Jan 8 15:53:01 2018 - permalink -
    QR-Code
    - https://www.joelonsoftware.com/
    bonnes-pratiques english informatique
  • CodeAhoy
    Excellent blog que je dévore ces temps-ci (j'en ai déjà posté deux articles ici), avec des nombreux articles, non pas techniques, mais plutot sur la culture informatique dans une boite ainsi que les concepts. L'auteur a été manageur informatique dans différentes boites, et en a tiré de précieuses connaissances sur la manière de gérer des projets informatiques qu'il ressort ici. À consommer sans modération.
    Fri Dec 22 14:16:51 2017 - permalink -
    QR-Code
    - https://codeahoy.com/
    bonnes-pratiques english informatique
  • Continuous Delivery - Automating the Release Process · CodeAhoy
    Qu'est ce que le Continuous Delivery et comment ca marche. Bon article qui m'a exactement fait comprendre pour le première fois la différence entre Continuous Integration, Continuous Delivery and Continuos Deployment :)
    Wed Dec 13 10:45:23 2017 - permalink -
    QR-Code
    - https://codeahoy.com/2016/06/18/continuous-delivery-automating-the-release-process/
    devops explications
  • explainshell.com - match command-line arguments to their help text
    Un site pour expliquer argument par argument chaque commande shell que vous lui indiquez. Uniquement basé sur du parsing de man, mais très pratique pour comprendre une grosse commande shell trouvée sur Stackoverflow par exemple (au lieu de l'appliquer betement sans la comprendre, ce que personne ne fait jamais bien évidemment...)
    Mon Dec 11 08:58:34 2017 - permalink -
    QR-Code
    - https://explainshell.com/
    linux shell
  • Every Noise at Once
    Une dataviz classifiant tous (enfin; un bon nombre) les genres de musique par proximité, avec des extraits musicaux pour chacun. On est ou pas d'accord, mais c'est clairement un travail très intéressant effectué informatiquement.
    Sat Dec 9 17:43:40 2017 - permalink -
    QR-Code
    - http://everynoise.com/engenremap.html
    dataviz musique
  • Adieu TeamViewer
    Quelques outils pour partager son écran sur un logiciel à distance sans utiliser teamviewer
    Fri Dec 1 21:36:39 2017 - permalink -
    QR-Code
    - https://www.metal3d.org/ticket/adieu-teamviewer
    jdh outil
  • #RGPD : 10 recommandations de sécurité informatique - Open-Freax
    Quelques recommandations sur comment sécuriser informatiquement son entreprise. Arriver à un niveau pareil peut-être difficile, mais il est selon moi important de faire quelque chose à son niveau (il vaut mieux quelques règles simples que rien du tout). Cet article donne de bonnes idées là dessus
    Fri Dec 1 21:30:34 2017 - permalink -
    QR-Code
    - https://open-freax.fr/rgpd-10-recommandations-securite-informatique/
    recommandations sécurité
  • Quelles sont les raisons de boycotter Microsoft
    Pas grand chose à ajouter franchement. Je retravaille sur windows depuis 8 mois pour ma plus grande peine malheureusement. Sans parler de Azure qui n'est nettement pas à la hauteur des autres cloud (niveau fiabilité, ergonomie et usabilité)
    Thu Nov 30 11:37:01 2017 - permalink -
    QR-Code
    - http://www.sebsauvage.net/wiki/doku.php?id=microsoft
    evil microsoft
  • Welcome to Python cheatsheet! — pysheeet
    Cheat sheets sur plein de trucs en Python. Peut servir
    Wed Nov 29 22:11:53 2017 - permalink -
    QR-Code
    - https://www.pythonsheets.com/
    cheatsheet python
  • Positive Technologies - learn and secure : Random Number Security in Python
    Nombre aléatoire et sécurité en Python, avec quelques conseils pour sécuriser son serveur web.
    Tue Nov 28 17:38:05 2017 - permalink -
    QR-Code
    - http://blog.ptsecurity.com/2012/10/random-number-security-in-python.html
    python sécurité
  • I'm doing 100+ projects in Python to learn the language. Thought someone else might want to do the same. : learnpython
    Un portfolio de projets (simples ou moins simples) à faire pour se perfectionner en Python. Peut se faire avec un autre langage.
    From Pwass: shaarli.nicolas-cellier.net.
    Wed Nov 22 10:43:45 2017 - permalink -
    QR-Code
    - https://www.reddit.com/r/learnpython/comments/1huuqk/im_doing_100_projects_in_python_to_learn_the/
    english learning python
  • À quoi servent les différents répertoires & points de montage Linux
    Explication sur les différents répertoires Linux. À garder
    Thu Oct 26 16:36:23 2017 - permalink -
    QR-Code
    - https://buzut.fr/points-de-montage-linux/
    linux
  • 7 reasons why Azure might beat AWS in the cloud wars
    Ou pourquoi Azure pourrait battre AWS dans la guerre des Cloud. Articles qui se focalisent uniquement sur les aspects non techniques, ce qui est intéressant (car meme si j'ai beaucoup bossé sur Azure et peu sur AWS, ce dernier est pour moi largement supérieur niveau technique). Mais on sais tous que ce n'est pas forcément l'aspect technique qui est primordial pour le choix d'une technologie dans un contexte de grande entreprise...
    Après il n'y a pas vraiment de 'gagnant', ni de 'guerre'. Tout domaine informatique évolue très vite, on l'a toujours vu, et une technologie qui semble en monopole à un moment peut toujours etre remplacé (bon, ok, à paart windows pour le moment). C'est d'autant plus vrai pour moi qu'avec le Cloud, il est beaucoup plus facile d'avoir la main sur son infra, et donc de la changer rapidement, ce qui est moins le cas pour un infra on-prem.
    Thu Oct 12 10:46:28 2017 - permalink -
    QR-Code
    - https://www.linkedin.com/pulse/7-reasons-why-azure-might-beat-aws-cloud-wars-has-nothing-goswami/
    cloud english
  • Entrepreneur d'Intérêt Général
    Appel à candidature pour des projets d'utilité publiques proposées par différentes administrations. Ça a honnêtement l'air vachement cool ! Je vous laisse regarder tout ça, mais dommage que je ne sois pas en France pour candidater. Peut-être l'année prochaine.
    Wed Oct 11 22:21:55 2017 - permalink -
    QR-Code
    - https://entrepreneur-interet-general.etalab.gouv.fr/
    société
  • TIAD Camp Docker : Retour sur la journée D2SI Blog
    Retour intéressant sur la journée sur Docker organisée par D2SI, SSII sur Paris. Les expériences sont vraiment intéressants. Bon par contre, moi qui veut me mettre plus là-dedans, ça me montre que j'ai encore des trucs à apprendre... Bard, ça viendra
    Wed Oct 11 22:19:05 2017 - permalink -
    QR-Code
    - http://blog.d2-si.fr/2017/10/11/tiad-camp-docker-retour-journee/
    devops docker
  • Current state automated Machine Learning
    Petite description de ce qu'est l'auto Machine Learning et des principales librairies pour en faire. Le principe ? Laisser une librairie trouver les meilleurs algorithmes et paramètres pour établir un modèle. C'est une idée à laquelle j'avais déjà réfléchi en tant qu'informaticien s'intéressant à la Data-Science. Pourquoi s'embeter à tester différents paramètres quand on peut automatiser le tout ? Avec, à la clé, un gain de temps pour le data-scientist qui peut passer son temps sur des algorithmes autrement plus compliqués. À voir comment cela évoluera dans le futur.
    Fri Sep 22 15:21:57 2017 - permalink -
    QR-Code
    - http://www.kdnuggets.com/2017/01/current-state-automated-machine-learning.html
    datascience english machine-learning
  • How to Avoid the 'Seven Deadly Sins' of a Level 2 PMO Published: 29 December 2016 ID: G00314156
    Un article de Gartner expliquant les erreurs à éviter en tant que chef de projet informatique. Assez intéressant, mais ne s'applique qu'aux grosses boites, quand le Business est impliqué. Pas applicable à toute situation du coup, mais pas mal de choses sont intéressantes e tpeuvent etre reprise.
    Tue Sep 19 14:13:30 2017 - permalink -
    QR-Code
    - https://www.gartner.com/doc/reprints?id=1-48SFTCU&ct=170803&st=sb#dv_5_for_eight
    english gestion-projet
  • How to support full Unicode in MySQL databases · Mathias Bynens
    Petit truc qui m'a bien saôulé ce week-end, du coup je m'explique.
    De puis la dernière mise à jour de mon blog sur le jonglage (jonglage.bwatt.eu), les accents des derniers articles uploadés apparaissent bizarrement. En gros, problème d'encoding.
    Après un petit test, pas de souci quand je lance le code directement en local, mais sur mon environnement de dev, oui. Point commun avec la prod ? Ça tourne sur Docker. Le code n'est donc pas en cause.
    Après avoir fouillé un moment, je me suis aperçu que ma mariadb sur Docker n'était pas en utf8, mais en latin1 ! Et il semble que ça soit la configuration par défaut de mariadb (je ne comprend pas qu'on puisse avoir ça par défaut). Quand on installe par les paquets sur archlinux ou sur Lint, c'est assez intelligent pour mettre en utf8. Mais il semble qu'ils aient oublié de faire ça sur la dernière image Docker...
    La solution ? Relancer mariadb avec des flags pour être en utf8 (mysqld --character-set-server=utf8mb4 --collation-server=utf8mb4_general_ci --character-set-client-handshake=FALSE). Ou plutôt en utf8bm4. Car j'ai après dû changer l'encodage de mes tables et database en utf8, et suis tombé sur ceta rticle, expliquand qu'il faut utiliser utf8bm4 et non utf8. Je poste ça donc ici.
    Mon Sep 18 22:21:07 2017 - permalink -
    QR-Code
    - https://mathiasbynens.be/notes/mysql-utf8mb4
    astuce database docker
  • Comment utiliser drone-ci pour tester vos images docker ? - (Debian/Ubuntu) · Blog de Victor Hery
    Automatisation de build et de tests sur Docker avec Drone. Peut être utile.
    Wed Aug 16 08:01:15 2017 - permalink -
    QR-Code
    - https://blog.victor-hery.com/2017/07/build-et-test-custom-image-drone-ci.html
    devops docker
  • Les agriculteurs hackeurs du Nebraska
    Les agriculteurs font de la résistance au Nebraska contre les grandes firmes. Au programmes de celles-ci : verrouillage des logiciels des tracteurs, brevets à gogo, et récupération à tout va de big-date dans le but à terme de remplacer l'humain. Encore une fois où je n'approuve pas l'usage non éthique des big-data, même si c'est mon boulot (quant aux brevets, n'en parlons pas). Assez moche mais au moins les gens essaient de s'organiser contre eux. Affaire à suivre
    Mon Aug 14 10:23:54 2017 - permalink -
    QR-Code
    - http://mobile.lemonde.fr/pixels/visuel/2017/08/08/agro-hackeurs-du-nebraska_5170156_4408996.html
    agriculteur big-data brevet
  • SOAT Blog » Apache Kafka – Genèse, Concepts et Fonctionnement du message-broker du big-data
    Une assez bonne description de Kafka, outil de messaging en train de prendre une place prépondérante dans le monde Big-Data
    Tue Aug 8 18:24:37 2017 - permalink -
    QR-Code
    - http://blog.soat.fr/2017/04/apache-kafka-concepts/
    big-data outil
  • Python Mock Gotchas - Alex Marandon
    Autre article sur les Mocks en Python, avec quelques erreurs courantes expliquées.
    Wed Jul 5 14:04:51 2017 - permalink -
    QR-Code
    - http://alexmarandon.com/articles/python_mock_gotchas/
    how-to python test
  • Real Life Mocking - The Engine Room
    Comment utiliser la librairie Mock pour des usages un peu poussés. Cette librairie permet de simuler certains appels de fonctions en Python, ce qui est très utile pour implémenter des tests unitaires qui requiert des appels à des systèmes externes. Ici, l'auteur explique comment simuler les appels HTTP à une API externe, et ainsi ne plus dépendre de si elle est disponible ou pas pour que nos tests fonctionne.
    Pour les intéressés, l'article donne un lien vers un article plus simple sur Mock.
    Wed Jul 5 11:49:33 2017 - permalink -
    QR-Code
    - http://engineroom.trackmaven.com/blog/real-life-mocking/
    how-to python test
  • Stream Processing and Probabilistic Methods: Data at Scale
    Description des différents moyens de traiter des streams de manière probabiliste. Les méthodes classiques sont en effet parfois trop lourdes et requiert plus de mémoire. Ici, on ne s'attache pas à l'exactitude des résultats, mais à en faire une approximation. La plus célèbre de ces méthodes étant le bloom filter (déjà évoqué dans un précédent article)
    Wed Jul 5 11:37:18 2017 - permalink -
    QR-Code
    - http://bravenewgeek.com/stream-processing-and-probabilistic-methods/
    probabiliste stream
  • Paxos made live
    Un papier de Google décrivant la difficulté à mettre en oeuvre le protocole Paxos (ici utilisé pour développé Chubby, un système par GFS et Big Table). Comme auoi, de la théorie à la pratique il y a toujours un gap (car Paxos lui même est très bien documenté). La difficulté majeure, selon les auteurs, est qu'il n'y a pas assez d'outils créés par la communauté des algorithmes fault-tolerance, et que du coup il est très dur de tester et développé dessus.
    Papier un peu long et ardu (un papier de recherche quoi), mais je commence à m'intéresser de plus en plus aux papiers : les articles c'est bien, mais ne suffisent en général pas dès qu'on veut vraiment rentrer dans le détail. Après, se manger un PDF d'une quinzaine de pages, avec quasiment pas de schémas, ca prend du temps il faut bien l'avouer... Pour les plus motivés du coup.
    Thu Apr 20 16:02:05 2017 - permalink -
    QR-Code
    - https://static.googleusercontent.com/media/research.google.com/de//archive/paxos_made_live.pdf
    distribué paxos
  • Big Data : les histoires d’Hadoop finissent mal (en général)
    Pourquoi les architectures Big-Data finissent par échouer en général. Un truc que j'avais déjà entendu il y a peu (par Gartner, qui a sorti que 70% des projets échoueront cette année !). C'est vrai que c'est un truc que j'ai souvent vu : des projets qui ne passent jamais l'étape du PoC. À cela plusieurs raisons selon moi :
    - qui dit Big-Data dit Big-Architecture. Et donc difficile à maintenir. Un PoC ça va, mais maintenir ensuite demande du temps, des compétences, des gens et de l'argent. Ce que les entreprises ne sont pas prêtes à mettre
    - ce qui amène au deuxième point : le manque de formation. Les projets sont en général faits par des externes qui maitrisent le sujet, et il y a peu de passation de connaissance. Que ce soit la faute de l'un ou de l'autre. Du coup, on se retrouve souvent avec des gens qui quand ils doivent s'éloigner d'une procédure établie, où on leur a donnée chaque commande, sont perdus. Le mieux est selon moi d'intégrer un interne lors du développement du projet afin qu'il puisse se faire la main dessus. Et ça, c'est rarement fait (par manque de temps, de budget, et à cause du "on verra bien plus tard" Trop tard souvent)
    - les projets sont trop aboutis. La faute au effet hype (avec des articles qui promettent monts et merveille) et des boites qui mettent des étoiles dans les yeux des clients pour réussir la vente. Sauf qu'il faut ensuite réaliser le produit, et que ça s'avert beaucoup moins performant qu'annoncé, ce qui décoit le client. Les prestataires se disent que si elles ne font pas cela, elles n'auront pas de projets, mais c'est faux : une personne technique d'une boite sera toujours rassuré quand on lui dit qu'on va d'abord mettre un truc simple en place pour voir, et qu'ensuite on avisera (et c'est ces personnes-là qu'il faut viser !). C'est selon moi la meilleure façon de procéder : d'abord résoudre un problème que les gens ont, avec un projet simple, ce qui mettra le client en confiance, et lui donnera ensuite envie de signer pour plus gros (et le fidélise donc !). Personne n'a envie de tout changer d'un coup (surtout dans une grande entreprise, qui sont la majorité des clients en Big-Data !), donc l'approche petit à petit donne une chance de réussir, alors qu'un gros changement a toutes les chances d'échouer (quelque chose pour moi qui est très vrai dans beaucoup de situations).
    Tue Apr 11 20:52:30 2017 - permalink -
    QR-Code
    - http://www.silicon.fr/big-data-histoires-hadoop-finissent-mal-en-general-172035.html
    big-data réflexion
  • Oui, Illico ! - LinuxFr.org
    Outil de nettoyage sur lequel je suis tombé. À tester un de ces quatre.
    Tue Apr 11 20:51:32 2017 - permalink -
    QR-Code
    - https://linuxfr.org/news/oui-illico
    data outil
  • 5 services que systemd m’a déjà rendu | OCTO talks !
    Description des possibilités offertes par systemd, ça a l'air assez intéressant ! J'ai déjà une petite idée de comment l'utiliser. Je sais que systemd a fait couler pas mal d'encre, mais je pense que le débat était un peu inutile, il y a d'autres trucs sur lequels se prendre la tête. Et actuellement, la majorité des distributions l'ont adoptés, c'est donc que ça finit quand même par faire consensus (et init.d avait vraiment besoin d'un rempllaçant).
    Tue Apr 11 20:49:29 2017 - permalink -
    QR-Code
    - http://blog.octo.com/5-services-que-systemd-ma-deja-rendu/
    linux outil
  • Jepsen: MongoDB 3.4.0-rc3
    MongoDB ne perd plus de données ! Alors que depuis le début, Mongo était réputé pour perdre des données (à tel point aue je le déconseillais systématiquement), l'équipe a fait de gros efforts pour stabiliser le système, à tel point que Mongo passe désormais le Jepsen Test (LE test à suivre pour connaitre la stabilité d'une base de donnée distribuée). Comme quoi il faut mieux lancer une base instable mais sexy et avec beaucoup de fonctionnalités, et ainsi attirer beaucoup d'utilisateurs dès le début, plutot que de construire quelque chose de fiable, mais qui prendra beaucoup de retard. C'est amoral mais bon...
    En tout cas, j'ai un certain nombre de nouveaux papiers/articles à lire sur la consistence et la Linearizability (EDIT: qui est en fait l'atomicité en francais. Je viens de comprendre plein de trucs d'un coup...) maintenant... À suivre
    Tue Apr 11 14:30:22 2017 - permalink -
    QR-Code
    - http://jepsen.io/analyses/mongodb-3-4-0-rc3
    bigdatahebdo database
  • GitHub - facebookresearch/visdom: A flexible tool for creating, organizing, and sharing visualizations of live, rich data. Supports Torch and Numpy.
    Librairies de visualisation en Python. Pratique pour du prototypage apparamment. À tester éventuellement (fournis par Pwass : http://www.nicolas-cellier.net/ et shaarli.nicolas-cellier.net)
    Wed Mar 29 18:44:45 2017 - permalink -
    QR-Code
    - https://github.com/facebookresearch/visdom
    datavisualition librairie python
  • Roadmap Linux, Docker et stratégie open source sur Azure
    Un article sur la stratégie Open-Source chez Azure. Pas très poussé, mais il y a des éléments intéressants.
    Wed Mar 29 14:57:43 2017 - permalink -
    QR-Code
    - https://www.infoq.com/fr/articles/linux-docker-azure-jose-miguel-parella
    azure cloud open-source
  • Raft Consensus Algorithm
    Description de l'algorithme Raft, permettant de faire du consensus entre plusieurs serveurs (et utilisé par cockroachDB). Similaire à Paxos (que je compté étudier prochainement).
    Tue Mar 28 18:20:21 2017 - permalink -
    QR-Code
    - https://raft.github.io/
    algorithme big-data
  • Google Spanner Inspires CockroachDB To Outrun It
    La version Open-Source de Spanner (évoqué dans l'article précédent). Pas aussi efficace, bien sûr (car eux ne maitrise pas le hradware), mais quand même. L'article évoque notamment les différences majeures entre les deux outils.
    Mon Mar 27 21:52:32 2017 - permalink -
    QR-Code
    - https://www.nextplatform.com/2017/02/22/google-spanner-inspires-cockroachdb-outrun/
    big-data outil
  • Spanner, TrueTime & The CAP Theorem
    Un article tiré d'un des derniers bigdatahebdo sur spanner, le dernier-né dans la galaxie big-data chez Google Cloud. Il s'agit d'un des papiers blances qu'ils publient régulièrement. Un peu ardu, mais pas trop long pour une fois, donc accessible.
    Spanner est un outil voulant réconcilier Big-Data et SQL, avec des possibilités énormissimes. Google a notamment réussi à contourner le fameux CAP théorème, grâce à une alliance de Hardware et de Software. Il n'y a qu'eux pour réussir un truc pareil (il n'y a pas grand monde qui maitrise aussi bien ces deux aspects). Pour la petite histoire, cela s'est notamment fait en installant des horloges atomiques dans leurs datacenters...
    Mon Mar 27 21:47:53 2017 - permalink -
    QR-Code
    - https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45855.pdf
    big-data bigdatahebdo google
  • BigData Hebdo
    Un podcast fait sur le big-data par mon ancien chef et un de ses amis. Ils rassemblent des articles de news sur le big-data, et les aborde en les analysant. Un très bon moyen de se tenir au courant du monde du big-data !
    PS : dorénavant, tous les articles provenant de ce podcast seront taggés bigdatahebdo
    Mon Mar 27 21:46:14 2017 - permalink -
    QR-Code
    - http://bigdatahebdo.azurewebsites.net/
    big-data podcast
  • Réduire les temps de développement sans sacrifier la qualité - LinuxFr.org
    Un article sur la manière de conduire un projet pour ne pas perdre trop de temps. Je n'adhère pas à tout, mais il y a des idées intéressantes, qui rejoignent certaines choses que j'avais déjà tirée de ma (modeste) expérience à développer des projets. J'aime bien notamment tout ce qui incite à ne pas en faire trop. C'est vrai qu'en tant que développeur on a tendance à vouloir faire un outil super élégant, modulable et avec pleins de fonctionnalités. Sauf que à la fin le client finit toujours par n'en utiliser que la moitié. Mieux vaut se concentrer sur le périmètre et la documentation, quitte à avoir un outil un moins adaptable, et dont on est moins fier, "codiquement" parlant. Mais ça fait gagner tellement de temps.
    Fri Feb 24 09:54:24 2017 - permalink -
    QR-Code
    - http://linuxfr.org/users/lebouquetin/journaux/reduire-les-temps-de-developpement-sans-sacrifier-la-qualite
    développement gestion-projet
  • ExplainShell, un outil pour expliquer une commande Linux - Informatique générale - ShevArezo`Blog
    Un outil qui va parcourir les MANs pour expliquer une commande Linux (trouvée sur internet par exemple). Peut-être pratique, je le garde là.
    Fri Feb 24 09:53:17 2017 - permalink -
    QR-Code
    - http://blog.shevarezo.fr/post/2017/02/23/explainshell-outil-expliquer-commande-linux
    command-line linux outil
  • « Que faut-il pour XXX ? » « Du logiciel libre ! » Non, une gouvernance éthique !
    Une critique du "tout" logiciel libre, prônant plutôt d'aller vers la gouvernance éthique. Bah oui, vous pouvez avoir une entreprise qui utilise uniquement de l'open source, mais derrière ne dit rien de ce qu'elle fait derrière. Donc ça ne suffit pas (ça rejoint un peu ce que fait Framablog). Sans rejoindre trop le fait de se passer du logiciel libre, c'est vrai que ce n'est plus l'unique objectif. Il faut aussi voir ce qu'il y a derrière. C'est marrant, je tombe de plus en plus sur des "critiques" du logiciel libre en ce moment, ce que je trouve pas mal. C'est ce qui permet de le remettre en question, et ainsi faire évoluer la question. Sachant que si on ne fait pas ça, on tombe dans le fanatisme, ce qui est quelque chose que je déteste (quel que soit la thèse défendue).
    Fri Feb 24 09:48:55 2017 - permalink -
    QR-Code
    - https://blog.imirhil.fr/2017/02/21/logiciel-libre-gouvernance-ethique.html
    open-source réflexion
  • GrapheekDB : Base graphe en Python - Raphaël Braud - Nidus
    Une nouvelle base graphe en pure python. À garder sous le coude, ça peut être intéressant !
    Fri Dec 9 21:52:04 2016 - permalink -
    QR-Code
    - http://www.nidus.fr/blog/grapheekdb-base-graphe-python/
    database graphe python
  • Sortez vos capacités - LinuxFr.org
    Article sur les condensateurs
    Tue Nov 29 22:54:53 2016 - permalink -
    QR-Code
    - https://linuxfr.org/users/niconico/journaux/sortez-vos-capacites
    condensateur électronique
  • How to Retry with Class - miguelgrinberg.com
    Un article par le créateur de Flask sur comment implémenter une politique de retry dans une application multi-micro-services, pour éviter que la mise à jour d'un deux fasse tomber toute l'application. Un article que j'aurais bien aimé avoir sous la main pour certains de mes anciens projets... Mais mieux vaut tard que jamais !
    Mon Nov 28 22:15:37 2016 - permalink -
    QR-Code
    - https://blog.miguelgrinberg.com/post/how-to-retry-with-class
    concept flask python
  • Découvrons la programmation asynchrone en Python
    Une bonne introduction à la programmation asynchrone en Python, avec toutes les nouveautés amenées dans python 3.5 (await et tout ça). Un truc sur lequel il faudra que je me penche sérieusement un jour, ça doit faire gagner pas mal de temps. Je garde ça en tête
    Mon Nov 21 20:36:15 2016 - permalink -
    QR-Code
    - https://zestedesavoir.com/articles/1568/decouvrons-la-programmation-asynchrone-en-python/
    asynchrone concept python
  • Services et tests d’intégration : ce qu’il faut savoir pour que ça se passe bien | OCTO talks !
    Une description détaillée de comment mener des tests d'applications sur une architecture complexe avec de nombreux services. Ce que j'aime bien, c'est qu'ils parlent pas mal des problèmes humains, sans se concentrer uniquement sur le technique comme beaucoup d'articles. De plus, ils utilisent beaucoup la règle du "ça prend du temps au début, mais ça en fait gagner sur le long terme", règle que peu de décideurs sont prêts à entendre, voulant toujours paré au plus pressé, ce qui finit par donner des projets interminables.
    Thu Nov 17 13:37:51 2016 - permalink -
    QR-Code
    - http://blog.octo.com/64480/
    bonnes-pratiques devops test
  • Understanding the Bias-Variance Tradeoff
    Pour comprendre le compromis biais-variance (l'une des choses les plus importantes en Machine Learning).
    Fri Oct 21 16:33:25 2016 - permalink -
    QR-Code
    - http://scott.fortmann-roe.com/docs/BiasVariance.html
    data-science english explications machine-learning
  • Qu'est ce qu'il se passe quand on ouvre une page web
    Une description pas à pas des différentes étapes qui se produisent quand on ouvre une page web. Très bonne vulgarisation, qui ne rentre pas trop dans les détails techniques.
    Fri Oct 21 14:19:20 2016 - permalink -
    QR-Code
    - https://iloth.net/2016/10/ce-quil-se-passe-quand-on-ouvre-une-page-web/
    explications web
  • Lifemap
    Ça fait longtemps que je n'avais pas posté une bonne vieille datavisualisation. C'est désormais chose faite avec cette belle carte du vivant réalisée par l'université de Lyon.
    Sun Oct 9 13:24:56 2016 - permalink -
    QR-Code
    - http://lifemap.univ-lyon1.fr/
    dataviz
  • Santé : ce que préparent les géants du numérique
    Comment le big-data va révolutionner la santé ("La rencontre du BigData et de la santé ouvre un cycle d’innovations sans précédent. On est dans le même type de saut vertigineux que la découverte des antibiotiques"). C'est sûr que ça va changer pas mal de choses. Après, il y a aussi beaucoup de risques, comme l'indique l'article. Si les assureurs commencent à jouer avec nos données de santé, ça va faire mal... Et ne me dites pas que les données sont sécurisées : quand on voit le désastre niveau sécurité informatique dans lequel on est, avec scandales à répétition, on est mal barré
    Sun Sep 18 15:19:36 2016 - permalink -
    QR-Code
    - https://www.franceinter.fr/societe/bigdata-et-sante-une-chance-ou-une-menace
    big-data santé
  • Un guide illustré pour enfant de Kubernetes
    Un petit guide bien fait avec bande dessinée à l'appui pour expliquer le fonctionnement de Kubernetes. Même si ce n'est pas trop mon domaine, je suis toujours intéressé par ce qui touche à l'automatisation, et notamment Docker (sur lequel tourne ce shaarli), et je compte bien un jour passer à Kubernetes et faire tourner tous mes conteneurs dedans.
    Tue Jul 26 18:18:23 2016 - permalink -
    QR-Code
    - https://deis.com/blog/2016/kubernetes-illustrated-guide/
    automatisation docker explications kubernetes
  • Artisan développeur - GBProd
    Une description du concept d'artisan développeur : l'auteur fait une analogie entre le métier d'artisan de son père et de son grand père et son propre métier de développeur. On y voit que développeur n'est pas forcément si un métier à part que ça. Entre outre, cela fait une bonne description de ce qu'est un bon développeur selon moi.
    Mon Jul 25 16:45:17 2016 - permalink -
    QR-Code
    - http://gb-prod.fr/2016/06/12/artisan-developpeur.html
    concept developpeur
  • YouTube thumbnail
    PyData Paris 2016 - Python and Big Data: a good match? - YouTube
    La vidéo de ma présentation sur Python et Big Data à pydata 2016. Ok, mon accent est pas terrible mais c'est ma première présentation dans un évènement de cette envergure !
    Pour résumer, j'explique en quelques points pourquoi Python me semble être un excellent langage pour faire du Big-Data.
    Tue Jul 5 14:37:11 2016 - permalink -
    QR-Code
    - https://www.youtube.com/watch?v=lVmlTOdVRok
    big-data conference fierte python
  • Educalab devient EdFab, la fabrique des nouvelles formations numériques. | Cap Digital
    Une nouvelle structure du pôle de compétitivité Cap Digital spécialisé dans le numérique, spécialisé dans les formations numériques, et dont un ancien collègue vient de prendre la tête. Si vous avez besoin de formations dans le numérique, ou de d'aide pour donner les vôtres, n'hésitez pas à aller voir de ce côté !
    Sat Jun 18 14:34:48 2016 - permalink -
    QR-Code
    - http://www.capdigital.com/edfab/
    formation numérique
  • Rachat de LinkedIn par Microsoft
    Une réflexion sur le rachat de LinkedIn par Microsoft, avec les dérives que cela peut entrainer. J'adore mon boulot et tout ce que Big-Data, mais comme toute nouvelle technologie, il ne faut pas oublier les risques de dérive possible...
    Thu Jun 16 15:17:34 2016 - permalink -
    QR-Code
    - http://www.affordance.info/mon_weblog/2016/06/digital-labor-microsoft-linkedin.html
    big-data fr réflexion
  • Une carte des compétences d'un datascientist
    Un vieux lien qui traine mais mérite d'être animé. Il représente une carte des compétences que doit avoir un datascientist, selon plusieurs axes. Un peu extrême dans le sens où il est impossible d'avoir toutes ses compétences, et où les domaines commencent à se séparer (mais le lien est un peu vieux aussi, 2013 !). Néanmoins il donne une idée de ce que peuvent être les prérequis.
    Thu Jun 16 10:29:19 2016 - permalink -
    QR-Code
    - http://nirvacana.com/thoughts/becoming-a-data-scientist/
    compétences datascience
  • Journal du hacker
    Un bon flux pour récupérer des news sur ce qui se passe dans le monde du hack. On y trouve pas mal d'informations sur Linux, Docker, Mozilla... Entièrement francophone.
    Mon Jun 13 12:26:51 2016 - permalink -
    QR-Code
    - https://www.journalduhacker.net/
    hacker news
  • OpenStack : Panorama | WeScale Blog
    Une explication de l'architecture OpenStack, permettant de crééer soi-même son Cloud privé, avec des descriptions module par module. Une bonne introduction pour avoir une idée de comment ça marche.
    Mon Jun 13 12:25:04 2016 - permalink -
    QR-Code
    - http://blog.wescale.fr/2016/05/18/openstack-panorama/
    cloud concept
  • PyData Paris 2016 |
    Un évènement portant sur python et la donnée. Au programme : conférences, tutoriaux et rencontres en tout genre. Avec en prime, un talk présenté par votre serviteur sur python et le Big Data !
    Mon Jun 13 12:22:38 2016 - permalink -
    QR-Code
    - http://pydata.org/paris2016/
    conference data python
  • Write Less Code · Code Ahoy
    'the best code is no code at all'
    Pour avoir dû repris du code complètement obsfusqué avec pleins de classes inutiles dans tous les sens, je suis complètement d'accord. Surtout que c'était en Python (qui est quand même fait pour écrire du code lisible à la base). Quand vous écrivez du code, PENSEZ TOUJOURS à Bernard (Bernard étant le nom générique du mec qui va reprendre votre code).
    via http://sebsauvage.net/links/?xJLq8Q
    Tue Jun 7 12:37:23 2016 - permalink -
    QR-Code
    - http://codeahoy.com/2016/06/03/write-less-code/
    bonnes-pratiques programmation
  • beta.gouv.fr
    Dans la même lignée que le dernier lien, un site recensant les nouvelles applications développées par des personnes de l'administration (j'ai vu une conférence d'un des développeurs au Devoxx qui m'a donné envie d'aller voir). En gros, au lieu de mettre 10000 ans à pondre un énorme site mal foutu façn administration, le but est de lancer pleins de mini-projets sous forme start-up pour avoir un prototype en 6 mois, et ensuite consolider si besoin. Au menu : une application pour consulter les droits auxquels on a besoin de manière anonyme, une pour faire une demande de bourse, d'autres pour aider les handicapés ou les retraités... Pour une fois qu'on va dans le bon sens, j'applaudis des deux mains !
    Tue May 3 16:25:09 2016 - permalink -
    QR-Code
    - https://beta.gouv.fr/
    etat modernisation service
  • faire simple | Innovons, simplifions
    Le site de modernisation des administrations en France. Pas encore très important, mais déjà une très bonne chose que ce soit lancé ! Après avoir vu quelques conférences, j'ai l'impression qu'on va avoir du lourd niveau numérique qui arrive par l'état français. Il était temps qu'on rentre dans le 21e siècle !
    Tue May 3 16:22:01 2016 - permalink -
    QR-Code
    - http://www.faire-simple.gouv.fr/
    etat modernisation technologie
  • fish-science – Quels outils pour la publication?
    Un petit article de notre ami pwasson (mais si, vous savez, j'ai déjà posté des liens qui venaient de chez lui) sur les outils de publication. Plutôt axé scientifique, mais toujours bon à prendre !
    Tue May 3 16:16:57 2016 - permalink -
    QR-Code
    - http://www.nicolas-cellier.net/quels-outils-pour-la-publication.html
    outil publication
  • Engineers Shouldn’t Write ETL: A Guide to Building a High Functioning Data Science Department | Stitch Fix Technology – Multithreaded
    Une description de la manière d'organiser sa team de data engineers/scientists. Ne s'applique pas vraiment dans le cas chez Affini-Tech où je travaille car on est trop peu nombreux et uniquement focalisés sur la data, du coup ça aurait peu de sens. Il y a bien des domaines qui se dégagent chez les personnes, en fonction des affinités et des études, mais le but est d'être tous polyvalent.
    Cela dit, j'aime bien la manière de voir, qui donne de l'intérêt à tout le monde et décloisonne les milieux. Pour moi, il n'y a rien de pire qu'une équipe où chacun à "sa" spécialisation et ne connait rien d'autre : c'est tellement plus efficace quand on a une vision, même très succinte, du domaine des autres (notamment pour ne pas aller voir pour des bugs complètement triviaux), ça suscite de l'interaction et du respect du travail des autres.
    Fri Apr 8 11:02:19 2016 - permalink -
    QR-Code
    - http://multithreaded.stitchfix.com/blog/2016/03/16/engineers-shouldnt-write-etl/
    data organisation
  • Le Blog d'Ippon Technologies - Big Data : Panorama des solutions 2016
    Avec l'explosion des outils Big-Data, arrive l'explosion des architectures différentes. Et autant pas mal de gens arrivent à maitriser le batch, autant les autres types (streaming, lambda...) sont encore assez exotiques en dehors de grosses grosses entreprises. C'est là-dedans qu'il y a du boulot marrant du coup :)
    Tue Apr 5 16:41:11 2016 - permalink -
    QR-Code
    - http://blog.ippon.fr/2016/03/31/big-data-panorama-des-solutions-2016/
    architecture big-data
  • 8 façons inhabituelles de se faire pirater – Le Blog du Hacker
    Tout est dans le titre
    Tue Apr 5 14:47:27 2016 - permalink -
    QR-Code
    - http://www.leblogduhacker.fr/8-facons-inhabituelles-de-se-faire-pirater/
    informatique securite
  • L’évolution des bottlenecks dans l’écosystème BigData | OCTO talks !
    L'évolution des technos big-data en fonction des différents bottlenecks rencontrés. C'est ultra-intéressants de voir les différe,ts problèmes et les solutions trouvés.
    Prochain problème à régler : le fameux Grabage Collector. Un autre article là-dessus pour ceux que ça intéresse : http://blog.octo.com/la-mort-prochaine-du-ramasse-miettes/
    Fri Mar 18 12:40:52 2016 - permalink -
    QR-Code
    - http://blog.octo.com/levolution-des-bottlenecks-dans-lecosysteme-bigdata/
    architecture big-data concept
  • L’U.T.C., sous toutes les coutures. | L'Atelier de Cartographie
    Description d'une série de projets réalisée dans une matière de mon ancienne école, tous articulés autour de la thématique de mieux comprendre l'école. Extrêment intéressant et cool comme projet ! J'avais déjà réalisé la matière à l'époque (voir ici pour le projet auquel j'avais participé : http://graph.data-publica.com/ ) et l'avait trouvé passionnante. J'avais alors commencé à comprendre le potentiel de la donnée, et son utilisation dans tous les domaines. Cela est très bien illustré ici : à partir de données brutes, on peut commencer à mieux comprendre le fonctionnement des études à l'UTC (pour ceux qui veulent plus d'informations sur le projet d'étude de consommations du pic'asso, le bar à bières de l'UTC, voir ici : https://ic05-picasso.herokuapp.com/).
    Mon Mar 7 10:37:16 2016 - permalink -
    QR-Code
    - https://ateliercartographie.wordpress.com/2016/02/25/lu-t-c-sous-toutes-les-coutures/
    data graphes utc
  • Spark et SQL-On-Hadoop : vers un Hadoop augmenté
    Un peu de Hadoop, ça faisait longtemps ! C'est vrai que, travaillant actuellement moins avec cet écosystème, je tombe sur moins d'articles. L'occasion de me rattraper avec un article pointant vers un grand nombre d'autres articles centrés sur des outils de l'écosystème Hadoop. À Consommer sans modération
    Thu Mar 3 16:26:41 2016 - permalink -
    QR-Code
    - http://www.lemagit.fr/essentialguide/Spark-et-SQL-On-Hadoop-vers-un-Hadoop-augmente
    big-data hadoop
  • The Python Interface: Comparing Its Many Implementations | Toptal
    Une explication des différentes implémentations de python (car oui, python, en soi, n'est qu'un interface).
    Mon Feb 29 17:02:03 2016 - permalink -
    QR-Code
    - https://www.toptal.com/python/why-are-there-so-many-pythons
    concept python
  • Scikit Flow: Easy Deep Learning with TensorFlow and Scikit-learn
    Nouveau venue dans la sphère du Machine Learning (Novembre 2015), TensorFlow a effectué un démarrge foudroyant (dépassant même largement scikit-learn sur github, la référence en machine learning python). Pourtant, il semble que la librairie soit parfois moins intuitive. D'où l'idée de merger les deux dans une nouvelle interface, scikit flow
    Thu Feb 18 16:27:30 2016 - permalink -
    QR-Code
    - http://www.kdnuggets.com/2016/02/scikit-flow-easy-deep-learning-tensorflow-scikit-learn.html
    machine-learning python
  • 4 idées reçues sur le Machine Learning | FrenchWeb.fr
    Une bonne explication simple du Machine Learning en démontant quelques idées reçues. Et oui, bien que Big Data et ML sont deux domaines très liées, ils sont quand même bien séparées et indépendants (la preuve, mon école enseignait du ML depuis plus de 10 ans, soit avant l'apparition du Big Data en tant que tel).
    Merci à Aurélie pour le lien
    Wed Feb 10 11:18:34 2016 - permalink -
    QR-Code
    - http://www.frenchweb.fr/4-idees-recues-sur-le-machine-learning/225482
    concept machine-learning
  • Not so exceptional anymore « jnosal
    Quelques manières de gérer les exceptions en python, avec les bons patterns.
    Wed Feb 10 11:17:16 2016 - permalink -
    QR-Code
    - http://jnosal.logdown.com/posts/490031-not-so-exceptional-anymore
    bonnes-pratiques python
  • Good logging practice in Python « Victor Lin's coding notes
    Une très bonne introduction au logging en général, en python en particulier
    Tue Feb 9 16:37:01 2016 - permalink -
    QR-Code
    - http://victorlin.me/posts/2012/08/26/good-logging-practice-in-python
    bonnes-pratiques python
  • Il a choisi Linux et s’en félicite – Framablog
    Une belle plaidoirie d'un utilisateur qui tâche de passez entièrement en open-source. Espérons que ça en inspirera d'autres !
    Wed Feb 3 15:18:47 2016 - permalink -
    QR-Code
    - http://framablog.org/2016/02/02/il-a-choisi-linux-et-sen-felicite/
    framasoft linux open-source
  • Pipelining R and Python in Notebooks
    Jupyter continue d'évoluer tous les jours, avec notamment une très bonne intégration aujourd'hui du langage R (pour infos, il y a plus de 50 langages intégrés par jupyter). Et si vous avez du mal à vous décider entre R et python pour vos analyses, faites comme ici et utiliser les deux ! À voir de ce côté pour l'utilisation de R et sa transformation en slide si besoin (quand je vous dis qu'on peut tout faire avec Jupyter...) : https://www.continuum.io/blog/developer/jupyter-and-conda-r
    À noter aussi pour ceux que ça intéresse un projet intéressant, jupyterhub : https://github.com/jupyter/jupyterhub qui permet d'avoir un serveur jupyter multi-utilisateurs, chacun pouvant être relié à un user unix et à un répertoire de données. C'est ce qui me montre que jupyter commence à être assez mature pour être mis dans un système en production désormais (ce que l'on commence à faire chez des clients où on implémente des datalakes, avec de la donnée stockée et des notebooks jupyter dans différents langages pour interréagir avec, le tout parfois mixé à du docker)
    Fri Jan 29 14:14:36 2016 - permalink -
    QR-Code
    - http://blog.revolutionanalytics.com/2016/01/pipelining-r-python.html
    data-manipulation jupyter python
  • The Fallen of World War II - Data-driven documentary about war & peace
    Comment combiner deux de mes passions, l'histoire et la donnée ? Tout simplement en créeant une superbe dataviz interactive expliquant la seconde guerre mondiale. Un travail remarquable !
    Mon Jan 25 23:16:41 2016 - permalink -
    QR-Code
    - http://www.fallen.io/ww2/
    dataviz histoire
  • A quick puzzle to test your problem solving
    Un très bon article permettant d'expliquer le phénomène du biais de confirmation et ses défauts. Cela explique comment la majorité des gens vont se faire une idée toute faite sur un phénomène et rarement voir les faits qui remettent en cause cette idée (je simplifie énormément).
    Wed Dec 30 14:37:49 2015 - permalink -
    QR-Code
    - http://www.nytimes.com/interactive/2015/07/03/upshot/a-quick-puzzle-to-test-your-problem-solving.html?_r=0
    psychologie
  • Python debugging tools | ionel's codelog
    Un certain nombre d'outils pour debugger du python. À garder sous le coude.
    Tue Dec 8 10:04:08 2015 - permalink -
    QR-Code
    - http://blog.ionelmc.ro/2013/06/05/python-debugging-tools/
    debug how-to python
  • 10 Reasons Python Rocks for Research (And a Few Reasons it Doesn’t)
    Hé oui, en plus d'être un langage extrêmement polyvalent et très répandu dans le monde du Big-Data, python s'incruste de plus en plus dans le monde universitaire (en remplacement de Matlab notamment). Et ce n'est pas Nicolas Cellier qui me dira le contraire ! shaarli.nicolas-cellier.net pour ceux qui ne le savent pas encore (essentiellement du python scientifique). Bon le seul défaut, c'est que ça ne poste plus trop en ce moment...
    Fri Nov 13 17:39:53 2015 - permalink -
    QR-Code
    - https://www.stat.washington.edu/~hoytak/blog/whypython.html
    python scientifique
  • LSH : Plus proches voisins approximatifs
    Un nouvel algorithme décrit pour comparer les distances entre mots ou documents (à mettre enn parallèle avec la distance de Levenshtein pour ceux qui connaissent). En plus d'avoir l'air de donner de bons résultats, il est extrêmement scalable du fait de sa complexité linéaire. Ce qui est très intéressant dans le domaine du big data.
    J'y vois plusieurs utilisations : indexation plus poussée (même si je n'ai pas l'impression qu'elasticsearch l'implémente encore), recherche avancée, rapprochement de jeux de données (je sais pas si y en a déjà qui ont bossé sur des **** de noms de ville par exemple, mais perso, j'ai tout eu : avec et san tiret, avec et sans abréviation, etc...), nettoyage de données...
    Fri Nov 6 11:34:21 2015 - permalink -
    QR-Code
    - http://www.bluedme.com/lsh/
    algorithme big-data indexation
  • Qu’est-ce que le Data Lake, le nouveau concept "Big Data" en vogue - JDN
    Un article du JDN sur le concept de Data Lake écrit par mon chef, et relu et corrigé par moi-même ! Vraiment intéressant comme concept, en gros on regroupe toutes les données d'une entreprise dans une plateforme sans trop les structurer pour les avoir directement pour un usage futur (à la différence d'un datawarehouse où on les structure directement en vue d'un usage prévu).
    Wed Nov 4 10:43:24 2015 - permalink -
    QR-Code
    - http://www.journaldunet.com/solutions/cloud-computing/1165409-qu-est-ce-que-le-datalake-le-nouveau-concept-big-data-en-vogue/
    big-data concept
  • Some important streaming algorithms you should know about
    Une description par Ted Dunning (l'un des papes des moteurs de recommandation, actuellement chez MAPR) d'algorithme streaming plutôt pratique. Attention, ça parle pas mal d'algorithmes et de probabilités et il faut parfois s'accrocher !
    Fri Oct 23 12:17:25 2015 - permalink -
    QR-Code
    - https://www.mapr.com/blog/some-important-streaming-algorithms-you-should-know-about
    algorithme big-data
  • Python Project Howto - Python Project Howto
    Comment packager proprement un package python avec tout ce qu'il y a autour (test unitaires, documentation, PEP8, gestionnaire de version...) Un peu vieux, surtout au vu des outils utilisés (j'utilise plus pytest et pip que unittest et esay_install personnellement) mais complètement vrai sur la méthodologie. Un jour j'aurais mon package su pypi...
    Thu Oct 22 17:44:40 2015 - permalink -
    QR-Code
    - http://infinitemonkeycorps.net/docs/pph/
    python tutoriel
  • Statistical Modeling steps - Data Science Central
    Qui a dit que les explications d'un concept devait toujours être faite dans un environnement sérieux ?
    Thu Oct 22 09:08:57 2015 - permalink -
    QR-Code
    - http://www.datasciencecentral.com/m/blogpost?id=6448529%3ABlogPost%3A295424
    datascience fun tutoriel
  • Dégooglisons saison 2 : ils ne savaient pas que c’était impossible, alors ils l’ont fait ! | Framablog
    Un petit bilan de la campagne Degooglisons internet qui s'avère très positif ! C'est vrai que pour avoir déjà utilisé leurs outils (voire commencer à les mettre en place sur mon serveur), c'est très utile (sauf pour framacalc qui a eu quelques ratés, il faut bien l'avouer). Ça me donne bien envie de plus m'inverstir dans l'association. Peut-être via les framacolibris ? À voir
    Via http://liens.effingo.be/
    Mon Oct 5 14:26:28 2015 - permalink -
    QR-Code
    - http://framablog.org/2015/10/05/degooglisons-saison-2-ils-ne-savaient-pas-que-cetait-impossible-alors-ils-lont-fait/
    framasoft libre
  • Awesome Python
    Awesome ! Un autre awesome ! Non, on en parlait avec mon collègue et c'est vrai que des awesome trucs, on en voit partout (et je vous parle pas des "very exciting to announce you"). Ça me fera toujours marrer ce côté ultra-enthousiaste des nouvelles technos. Bref. Quoi qu'il en soit, un très grand listing de ressources en python, pour faire tout ce dont vous avez envie. Perso je compte me pencher sur tout ce qui est flask API et les notions de data validation.
    Tue Sep 29 09:43:31 2015 - permalink -
    QR-Code
    - http://awesome-python.com/
    listing programmation python
  • Awesome data engineering
    Un très grand listing d'outil pour réaliser du data engineering.
    Mon Sep 28 18:10:39 2015 - permalink -
    QR-Code
    - https://github.com/igorbarinov/awesome-data-engineering?utm_campaign=Data%2BElixir&utm_medium=email
    data-manipulation listing
  • Recommended Reading for Developers
    Une liste de livres fournie par un des fondateurs de Stackoverflow (que je vous encourage à consulter). Un jour, je les lirais tous, un jour (même si je pense que je vais m'attaquer à Design of Everything).
    Wed Sep 16 11:57:54 2015 - permalink -
    QR-Code
    - http://blog.codinghorror.com/recommended-reading-for-developers/
    bonnes-pratiques lecture programmation
  • Google Testing Blog: Just Say No to More End-to-End Tests
    Pourquoi préférer les tests unitaires et tests d'intégration aux tests end-to-end.
    Tue Sep 8 16:50:58 2015 - permalink -
    QR-Code
    - http://googletesting.blogspot.fr/2015/04/just-say-no-to-more-end-to-end-tests.html
    bonnes-pratiques test
  • Ipython est mort vive ipython 4.0
    Rare sont les outils qui ont pris une telle ampleur qu'ipython en si peu de temps (ce que github a bien compris en proposant désormais la visualisation des notebooks automatiquement). Parti d'une simple console python améliorée, c'est devenu une galaxie d'outils tous plus utiles les uns que les autres. À telle point que maintenir le tout cohérent devenait extrêmement compliqué. Les fondateurs du projet ont donc décidé de splitter le tout en packages indépendants, ce qui est expliqué ici.
    C'est ce que j'aime chez python, quand les développeurs se rendent compte qu'un truc devient inmaintenable et qu'il faut refactorer, ils le font rapidement au lieu de garder une grosse usine à gaz. C'est cette mentalité qu'on retrouve dans le passage de python 2 à 3, ou dans le merging des librairies semblables pour n'en garder qu'une avec le meilleur des fonctionnalités (quoi ? en java ils ont deux librairies officielles pour traiter le JSON...)
    Pour ceux que ça intéressent (@chris), quelques exemples d'utilisation d'ipython notebook :
    - pour expliquer des concepts : http://nbviewer.ipython.org/github/jkthompson/pyspark-pictures/blob/master/pyspark-pictures.ipynb
    - par des conférenciers : https://github.com/jorisvandenbossche/2015-PyDataParis/blob/master/pandas_introduction.ipynb
    - pour des tutos : https://github.com/rlabbe/Kalman-and-Bayesian-Filters-in-Python
    - dans des articles de blog : http://nbviewer.ipython.org/url/www.davidketchesoan.info/notebooks/mmf_pandas.ipynb
    - pour faire des analyses (avec pleins de graphiques en prime) : http://nbviewer.ipython.org/github/koldunovn/nk_public_notebooks/blob/master/Apache_log.ipynb
    - par des professeurs : http://www.innovation-pedagogique.fr/article112.html
    Enfin, pour finir en beauté (arrête de baver, voyons, ça tâche ton clavier), une très grande collection de ipython disponible ici : https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
    Tue Sep 8 11:42:11 2015 - permalink -
    QR-Code
    - https://linuxfr.org/news/ipython-est-mort-vive-ipython-4-0
    python transformation
  • À ceux qui mer répètent qu'on ne peut pas accueillir toute la misère du monde
    À garder sous le coude, c'est une phrase que j'entends de plus en plus (surtout avec la montée bleu marine...)
    Mon Aug 31 11:52:05 2015 - permalink -
    QR-Code
    - https://blogs.mediapart.fr/blog/rachel-nef/260615/ceux-qui-me-repetent-qu-ne-peut-pas-accueillir-toute-la-misere-du-monde
    réfugié société
  • The Best Code is No Code At All
    De l'importance de faire attention à son code (par l'un des fondateurs de stackoverflow, c'est pas rien).
    Wed Aug 26 16:48:02 2015 - permalink -
    QR-Code
    - http://blog.codinghorror.com/the-best-code-is-no-code-at-all/
    bonnes-pratiques code developpeur
  • A Visual Introduction to Machine Learning
    Une très bonne introduction visuelle au Machine Learning. En plus d'être très intéressante, elle permet en plus de montrer ce qu'il est possible de faire avec la librairie D3, dont j'ai déjà pas mal parlé ici.
    Mon Aug 10 11:38:28 2015 - permalink -
    QR-Code
    - http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
    dataviz english machine-learning tutoriel
Links per page: 20 50 100
◄Older
page 1 / 2
Shaarli - The personal, minimalist, super-fast, no-database delicious clone by the Shaarli community - Help/documentation