199 links
  • Bwatt's links
  • Home
  • Login
  • RSS Feed
  • Tag cloud
  • Picture wall
  • Daily
Links per page: 20 50 100
◄Older
page 1 / 2
  • Nous avons besoin d'une génération de magiciens
    Tellement d'accord avec ce qui est dit. Tellement de conflits, de problèmes pourraient être résolus si nous avions être pu éduqué à gérer nos angoisses, nos peurs, à savoir utiliser notre outil le plus précieux, c'est à dire notre cerveau (et pas dans un sens que rationnel, mais aussi émotionnel).
    J'en profite pour dire que l'orientation des articles qui vont être publiés ici risque de changer radicalement, vu que je suis en train de petit à petit quitter l'informatique pour entrer dans le domaine de l'hypnose et de l'accompagnement.
    Wed Feb 3 12:15:19 2021 - permalink -
    QR-Code
    - https://medium.com/@kevin.finel/nous-avons-besoin-dune-g%C3%A9n%C3%A9ration-de-magiciens-54f7f1c049ac
    cerveau hypnose
  • Amilitants
    Que dire de plus, sinon que j'ai déjà beaucoup eu le même sentiment, et que je suis entièrement d'accord.
    Wed Dec 16 00:27:26 2020 - permalink -
    QR-Code
    - https://edgard.fdn.fr/blog/index.php?post/2016/11/03/Amilitants
    militant
  • Big data quality at Criteo
    Le deuxième article
    Thu Feb 6 09:32:36 2020 - permalink -
    QR-Code
    - https://medium.com/criteo-labs/big-data-quality-at-criteo-66c6bd0d42d8
    concept data en
  • Data governance at criteo
    Série de deux articles (l'autre arrive après) sur la data governance et la data quality chez Criteo, deux sujets qui deviennent de plus en plus important dans les entreprises (notamment dans la mienne). En efft, il ne suffit pas de récupérer plein de données, il faut aussi être sûr qu'elles sont documentées et de bonnes qualités. Sinon vos utilisateurs perdront très vite confiance dedans, ce qui pose pas mal de problèmes.
    Thu Feb 6 09:30:45 2020 - permalink -
    QR-Code
    - https://medium.com/criteo-labs/data-governance-at-criteo-e13b4d5047a1
    concept data en
  • Réplication des données : enjeux et approches
    Un article intéressant et complet sur les différents moyens de répliquer la donnée dans les bases de données distribuées, avec avantages et inconvénients de chaque approche. Pas mal pour choisir quelle base on veut, et permet de préciser des concepts dont on a parfois connaissance, mais sans une vue exhaustive.
    Fri Jan 24 16:08:33 2020 - permalink -
    QR-Code
    - https://blog.ippon.fr/2020/01/20/replication-des-donnees-enjeux-et-approches/
    architecture database
  • Modern Data Practice and the SQL Tradition | Florents Tselai
    Un article défendant l'intérêt des bases SQL contre les bases NoSQL. Le SQL-bashing est effectivement quelque chose que j'ai pas mal vu (l'un de mes chefs disait il y a 5 ans que SQL allait mourir. Il a finis par reconnaitre qu'il s'était complètement gouré), souvent pour des mauvaises raisons (trop vieux, pas cassez shiny, trop rigide...). Et c'est vrai que je pensais en partie comme ça pendant un moment, en vantant énormément MongoDB par exemple (j'en suis revenu depuis), notamment pour sa souplesse. Or, par expérience, ce qui fait la souplesse et permet de démarrer très vite devient ensuite un enfer à maintenir. Avoir un schéma de base de données permet effectivement une énorme stabilité, qu'on est obligé de reproduire par plein de bidouille quand on utilise du NoSQL.
    Bref, l'article explique bien tout ça, et reflète bien mon avis là-dessus
    Mon Nov 18 09:28:46 2019 - permalink -
    QR-Code
    - https://tselai.com/modern-data-practice-and-the-sql-tradition.html
    database en
  • A framework for elegantly configuring complex applications
    NEw framework in python to manage configuration. Small thing, but in general you always finish by develop your custom tool when your project increase in complexity, so this could be very useful.
    Fri Oct 11 16:39:53 2019 - permalink -
    QR-Code
    - https://cli.dev/
    developpeur python
  • How we built a tool for validatubg big data workflows
    Présentation d'un outil pour voir les problèmes de qualité de données après avoir updaté un workflow. Pas mal d'idées intéressantes pour pouvoir garder une bonne data quality
    Mon Aug 26 13:42:22 2019 - permalink -
    QR-Code
    - https://engineering.klarna.com/how-we-built-a-tool-for-validating-big-data-workflows-170c196a4493
    data-engineer english
  • How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh
    Article très intéressant (bien qu'assez long) sur le concept de distributed data mesh : le but est en gros de ne plus faire un datalake monolithique, mais de le séparer entre toutes les teams. En gros, chaque product team devient responsable de la mise à disposition de ses datasets (comme elle l'est de ses APIs), grâce à un data engineer dans sa team et des outils mis à disposition par une autre équipe centrale de data engineer. Le concept est intéressant mais demande un gros changement de paradigme, et n'est utile selon moi que dans les grosses entreprises
    Thu Aug 22 15:44:38 2019 - permalink -
    QR-Code
    - https://martinfowler.com/articles/data-monolith-to-mesh.html
    data-engineer datalake english
  • Why not Airflow
    Description de Airflow (outil d'orchestration de data) et de ses limites. Assez d'accord sur le fond, Airflow est vraiment un outil qui révolutionne le data engineering, mais qui, comme tout nouvel outil révolutionnaire (tel Hadoop et Docker) soufre de pas mal de défauts. L'auteur recommander prefect, un nouvel outil pour faire ça, mais peut-être encore un peu jeune pour être fiable. À suivre
    Wed Aug 14 11:24:30 2019 - permalink -
    QR-Code
    - https://medium.com/the-prefect-blog/why-not-airflow-4cfa423299c4
    english orchestration outil
  • The Death of Big Data and the Emergence of the Multi-Cloud Era
    Description assez intéressante de la naissance et de la 'mort' du concept de Big-Data, et notamment Hadoop. Bien sûr, le Big-Data n'est pas mort, mais son utilisation en tant que domaine global l'est. Ce concept est maintenant suffisamment implanté pour qu'on utilise des concepts plus spécifiques, comme le streaming, le multi-cloud...
    Article que je comprend parfaitement mais qui me rend un peu triste, ayant commencé à travailler comme ingénieur big-data (maintenant plus data-engineer), quand le domaine était encore en pleine expansion (et totalement en mode fare-west). Maintenant les choses se sont un peu stabilisées : c'est à la fois plus simple et moins fun. Enfin, il reste encore de nombreux beaux challenges à adresser !
    Tue Aug 13 11:51:23 2019 - permalink -
    QR-Code
    - https://www.kdnuggets.com/2019/07/death-big-data-multi-cloud-era.html
    big-data english
  • The rise of dataops from the ashes of data governance
    Même axe que l'article d'avant, mais plus axé sur la comparaison avec l'avènement de la compilation et du versionnage de code, ainsi que sur l'opposition à la data governance.
    Thu Jun 6 18:25:39 2019 - permalink -
    QR-Code
    - https://towardsdatascience.com/the-rise-of-dataops-from-the-ashes-of-data-governance-da3e0c3ac2c4
    data-engineer english
  • DataOps Principles: How Startups Do Data The Right Way - Retina.ai
    Deux articles (celui-là et le suivant) sur le principe de DataOps. En gros, l'idée c'est de s'inspirer de la mouvance Devops pour l'appliquer à la donnée. Ça consiste à automatiser un maximum, et donner pas mal de pouvoirs aux utilisateurs qu'il puisse créer lui-même les tables qui l'intéresse. Ça englobe aussi la validation automatique de schéma, la reproductibilité, la simplicité... Pas mal de bon sens mais c'est toujours mieux de le voir expliciter
    Thu Jun 6 10:07:39 2019 - permalink -
    QR-Code
    - https://retina.ai/blog/dataops-principles/
    data-engineer english
  • Data profiling in the age of big data – Tech at Nordstrom – Medium
    Un outil open-source pour faire du data-profiling sur votre datalake (validation de schéma, statistiques de base...) Approche vraiment intéressante, car c'est fait en dehors du pipeline de données. Les outils utilisés sont aussi intéressants : Spark, Datadog, et surtout Jupyter + papermill pour piloter ça (solution dont je suis de plus en plus fan même si je n'ai jamais testé encore)
    Mon Jun 3 11:24:48 2019 - permalink -
    QR-Code
    - https://medium.com/tech-at-nordstrom/data-profiling-in-the-age-of-big-data-7675d486c89c
    data-engineer english jupyter
  • What is idempotence? - LispCast
    Brève explication du principe d'idempotence. Notion importante en web, notamment pour les services REST, mais aussi cruciale dans le monde de la data, surtout quand on commence à orchestrer ses jobs (si je relance mon job de la veille, je veux être dans le même état que celui dans lequel il était)
    Mon May 27 11:43:15 2019 - permalink -
    QR-Code
    - https://lispcast.com/what-is-idempotence/
    concept english
  • No frills data warehousing with dbt
    Brève explication de l'utilisation de dbt. En gros, ça permet de pouvoir observer facilement des changements de données dans une base, et de créer un pipeline de récupération et validation de données à partir de ça. Ou comment créer un ETL très facielement à partir de pas grand chose.
    Tue May 14 11:01:33 2019 - permalink -
    QR-Code
    - http://tamaszilagyi.com/blog/2019/2019-03-05-dbt/
    data-engineer english tools
  • GitHub - igorbarinov/awesome-data-engineering: A curated list of data engineering tools for software developers
    Big list of data-engineer tools, on every interesting domain
    Tue Apr 2 15:24:03 2019 - permalink -
    QR-Code
    - https://github.com/igorbarinov/awesome-data-engineering
    data-engineer english tools
  • Blockchain explained
    Explication visuelle du principe du blockchain. Ne rentre pas dans les détails, mais les bases sont là, et très bien expliquées.
    Fri Mar 8 13:57:15 2019 - permalink -
    QR-Code
    - http://graphics.reuters.com/TECHNOLOGY-BLOCKCHAIN/010070P11GN/index.html
    blockchain english explications
  • The rise of the data engineer
    Explications du rôle de data-engineer selon Maxime Beauchemin (créateur d'Airflow). Globalement d'accord sur sa vision (me considérant moi-même comme tel), même si je suis réticent sur certains détails.
    Thu Feb 28 17:43:19 2019 - permalink -
    QR-Code
    - https://medium.freecodecamp.org/the-rise-of-the-data-engineer-91be18f1e603
    data-engineer english
  • Data Lake formation with AWS Glue & Apache Drill – Dweep Sharma – Medium
    Construction d'un datalake chez redBus, avec des technos full cloud. Assez intéressant de voir les outils et les usages (surtout que je participe à la même chose dans ma boite :))
    Tue Feb 26 17:35:27 2019 - permalink -
    QR-Code
    - https://medium.com/@dweepks/data-lake-formation-with-aws-glue-apache-drill-676133e816bc
    big-data datalake english
  • Libération.fr – Wargames, l’art de la guerre à l’ère cyber
    Serie d'article sur la cyberguerre actuelle, traitant à la fois des cas politiques, économiques, législatifs... Vraiment très complet et extrêmement intéressant
    Sat Feb 16 11:42:24 2019 - permalink -
    QR-Code
    - https://www.liberation.fr/apps/2019/01/chronique-wargames/
    hacker
  • Taming data quality with circuit breaker
    Comment les data-engineers de quickbook gère leurs problèmes de données, à l'aide de court-circuit pour éviter que la donnée "sale" contamine la donnée propre. Pas mal car catégorise vraiment bien les différents problèmes de données possibles. On retrouve finalement certains mécanismes déjà mis en place (dans ma boite en tout cas), mais de manière plus claire. Bon on voit aussi que le chemin est long pour avoir un truc parfait mais bon, ça viendra !
    Tue Feb 12 09:40:15 2019 - permalink -
    QR-Code
    - https://quickbooks-engineering.intuit.com/taming-data-quality-with-circuit-breakers-dbe550d3ca78
    data-engineer data-pipeline english
  • Aggrator Leaf Tailer: an architecture for live analytics on event streams
    Le futur système pouvant potentiellement (je ne suis pas devin) remplacer la lambda architecture. En gros, la lambda architecture permet d'une part d'envoyer en streaming des données dans une base finale, qui peut-elle être utiliser pour faire du batch et vous renvoyer des analytics rapidement. On a ici le meilleur des deux mondes : streaming et batch. Le problème c'est que cela implique beaucoup de contrainte, pouvant être potentiellement résolues par l'ALT.
    Fri Feb 8 10:59:51 2019 - permalink -
    QR-Code
    - https://rockset.com/blog/aggregator-leaf-tailer-an-architecture-for-live-analytics-on-event-streams/
    architecture big-data english
  • How to deliver on machine learning projects
    Article lu il y a longtemps (je n'ai malheureusement pas pu poster de liens pendant longtemps à cause d'un problème de docker). L'auteur expose les différentes étapes pour itérer sur un projet de Machine Learning. Assez intéressant pour avoir une idée de comment procéder de manière logique, plutôt que de se lancer tête baissée sans savoir trop où on va.
    Thu Feb 7 09:47:45 2019 - permalink -
    QR-Code
    - https://blog.insightdatascience.com/how-to-deliver-on-machine-learning-projects-c8d82ce642b0
    english machine-learning
  • Using Virtual Environments in Jupyter Notebook and Python - Parametric Thoughts
    Utiliser plusieurs environnements virtuels directement dans Jupyter, peut toujours être utile
    Thu Feb 7 09:46:38 2019 - permalink -
    QR-Code
    - https://janakiev.com/til/jupyter-virtual-envs/
    jupyter tricks
  • Data’s Inferno: 7 Circles of Data Testing Hell with Airflow
    Comment pouvoir tester efficacement ses pipelines airflow. Pas mal de choses et d'aspect intéressant, et dont je compte bien m'inspirer, travaillant actuellement intensément sur Airflow
    Tue Jun 5 13:47:43 2018 - permalink -
    QR-Code
    - https://medium.com/@ingwbaa/datas-inferno-7-circles-of-data-testing-hell-with-airflow-cef4adff58d8?mkt_tok=eyJpIjoiTkRoalptTm1NbVJpWmpBNCIsInQiOiJUZUZTQU5XaGJpbUFWTjBRbkFwYjNPK2JMWWFUUFJjQWtpS2owNXBYZjhydUoxbXNyMkdIMnhMUkFsNFk0NDcyRDVHSlJhZnd6UmJNZ2RnSG42OW1OcldicXVqV3NhdTNuemEzcm00bkh0NzJpaG91VVVKMmZ5NXc1SmdDb20zUiJ9
    airflow big-data data-engineer
  • Catégorie : algorithme génétique - Xavier Nayrac
    Sèrie d'articles sur les algorithmes génétiques (fait de générer des solutions à un problème, puis croiser les meilleures d'entre elles pour arriver à une solution qui, après plusieurs générations, se rapproche de l'optimum (car oui on utilise ca en général pour des problèmes NP-complexe où la calcul de la solution optimale prendrait trop de temp)). Ne pas avoir peur du nombre d'articles, chacun d'entre eux décrit une étape de l'algorithme. Assez intéressant pour comprendre ce que c'est.
    Mon Mar 12 16:46:44 2018 - permalink -
    QR-Code
    - http://lkdjiin.github.io/blog/categories/algorithme-genetique/
    algorithme concept
  • Pour Noël, je comprends mon noyau GNU/Linux ! | Blog Eleven Labs
    Série d'articles expliquant comment compiler soi-même son noyau linux (en désactivant plein de drivers inutiles au passage pour booter plus vite). Bien que ça faille peur de base, ça a pas l'air si compliqué. Faut que je test un de ces 4.
    Fri Feb 16 17:25:43 2018 - permalink -
    QR-Code
    - https://blog.eleven-labs.com/fr/comprendre-kernel-linux/
    a-tester linux
  • Hackez votre supermarché : Voici 11 fruits et légumes que vous ne devriez acheter qu'une seule fois dans votre vie, si vous connaissez ces astuces !
    Astuces pour refaire pousser des légumes à partir de vos déchets. Une pratique que je fais depuis fort longtemps (à un moment, étudiant, j'avais un oignon et une patate qui poussait en même temps). Actuellement, j'en suis à une carotte et un avocat. À suivre !
    Wed Feb 14 22:13:00 2018 - permalink -
    QR-Code
    - https://www.demotivateur.fr/article-buzz/11-fruits-et-legumes-que-vous-ne-devriez-acheter-qu-une-seule-fois-dans-votre-vie-si-vous-apprenez-ces-petits-trucs-pour-les-regenerer-chez-vous--2972
    diy
  • Kitchen Soap – On Being A Senior Engineer
    Une bonne description des qualités qu'il faut pour l'auteru pour etre un senior engineer. Où il montre qu'on n'a pas uniquement besoin de techniques, mais surtout de maturité. Et cette maturité passe par la faculté de travailler en harmonie avec les autres (accepter les critiques, rester ouvert à tout le monde et pas seulement à l'IT...).
    Tue Feb 6 15:52:56 2018 - permalink -
    QR-Code
    - https://www.kitchensoap.com/2012/10/25/on-being-a-senior-engineer/
    bonnes-pratiques english informatique
  • Premiers pas avec Terraform - Zwindler's Reflection
    Introduction à l'outil terraform, dédié à l'abstraction de la construction d'une infrastructure sur différents cloud provider. Faut vraiment que je teste un de ces quatre (promis Crichon)
    Wed Jan 24 18:35:23 2018 - permalink -
    QR-Code
    - https://blog.zwindler.fr/2018/01/16/premiers-pas-avec-terraform/
    a-tester devops outil
  • AdminRezo » La sécurité avec Docker – Chapitre 1 : Le système
    Série d'articles sur la sécurité avec docker
    Wed Jan 24 18:26:19 2018 - permalink -
    QR-Code
    - https://blog.adminrezo.fr/2017/12/la-securite-avec-docker-et-les-containers-chapitre-1-le-systeme/
    docker sécurité
  • Do Things that Don't Scale
    Un article décrivant les bonnes pratiques à suivre quand on lance une start-up (spécifiquement une start-up développant un produit informatique B2C). Il peut se résumer en ceci : pensez uniquement à l'instant présent en recrutant un maximum d'utilisateurs et en satisfaisant le moindre de leurs besoins. D'où le titre de l'article : il n'est effectivement pas utile de trop prévoir (et donc de scale up), mieux vaut voir petit. Si vouy avez à scaler, vous verrez en temps utile (et ce sera un bon problème pour vous).
    Ca me fait pas mal penser au développement informatique, où une des règles d'or pour moir est : pas de pré-optimisation. Faites un truc petit, mais qui marche bien. Ainsi vous pourrez convaincre rapidement un client. L'optimisation viendra après, si nécessaire, quand vous aurez mieux cerner les besoins nécessaires (car pour moi 90% de la pré-optimisation est ensuite à jetter, car basé sur les besoins supposés du client, tels que vu dans le cahier des charges, et non sur ses besoins réels, qui se voient à l'usage).
    Mon Jan 22 11:09:02 2018 - permalink -
    QR-Code
    - http://paulgraham.com/ds.html
    bonnes-pratiques english informatique
  • Préparez-vous au RGPD en 12 points-clés - Open-Freax
    RGPD (ou GDPR en anglais) arrive. Cette nouvelle loi européenne sur la protection des données arrive, et plein d'entreprises essaient de se mettre à jour. Cet article explique comment bien s'y préparer en 12 points.
    Wed Jan 10 08:08:37 2018 - permalink -
    QR-Code
    - https://open-freax.fr/rgpd-12-mots-cles/
    données régulation
  • Joel on Software
    Un autre excellent blog sur les manières de travailler en informatique (très souvent cité par Codeahoy, le précédent blog shaarlié) mais aussi avec quelques pans plus techniques, écrits par l'un des deux fondateurs de stackoverflow. Un de ses meilleurs articles porte notamment sur 'The Joel test' (https://www.joelonsoftware.com/2000/08/09/the-joel-test-12-steps-to-better-code/), un test établi afin de trouver les entreprises qui ont selon lui la meilleure culture informatique (les entreprises qui postent des offres sur Stackoverflow doivent notamment y passer). À lire absolument pour avoir une idée du bonhomme (surtout vu que l'erticle renvoie vers pleeeeeeeeeeeeins d'autres articles intéressants).
    Mon Jan 8 15:53:01 2018 - permalink -
    QR-Code
    - https://www.joelonsoftware.com/
    bonnes-pratiques english informatique
  • CodeAhoy
    Excellent blog que je dévore ces temps-ci (j'en ai déjà posté deux articles ici), avec des nombreux articles, non pas techniques, mais plutot sur la culture informatique dans une boite ainsi que les concepts. L'auteur a été manageur informatique dans différentes boites, et en a tiré de précieuses connaissances sur la manière de gérer des projets informatiques qu'il ressort ici. À consommer sans modération.
    Fri Dec 22 14:16:51 2017 - permalink -
    QR-Code
    - https://codeahoy.com/
    bonnes-pratiques english informatique
  • Continuous Delivery - Automating the Release Process · CodeAhoy
    Qu'est ce que le Continuous Delivery et comment ca marche. Bon article qui m'a exactement fait comprendre pour le première fois la différence entre Continuous Integration, Continuous Delivery and Continuos Deployment :)
    Wed Dec 13 10:45:23 2017 - permalink -
    QR-Code
    - https://codeahoy.com/2016/06/18/continuous-delivery-automating-the-release-process/
    devops explications
  • explainshell.com - match command-line arguments to their help text
    Un site pour expliquer argument par argument chaque commande shell que vous lui indiquez. Uniquement basé sur du parsing de man, mais très pratique pour comprendre une grosse commande shell trouvée sur Stackoverflow par exemple (au lieu de l'appliquer betement sans la comprendre, ce que personne ne fait jamais bien évidemment...)
    Mon Dec 11 08:58:34 2017 - permalink -
    QR-Code
    - https://explainshell.com/
    linux shell
  • Every Noise at Once
    Une dataviz classifiant tous (enfin; un bon nombre) les genres de musique par proximité, avec des extraits musicaux pour chacun. On est ou pas d'accord, mais c'est clairement un travail très intéressant effectué informatiquement.
    Sat Dec 9 17:43:40 2017 - permalink -
    QR-Code
    - http://everynoise.com/engenremap.html
    dataviz musique
  • Adieu TeamViewer
    Quelques outils pour partager son écran sur un logiciel à distance sans utiliser teamviewer
    Fri Dec 1 21:36:39 2017 - permalink -
    QR-Code
    - https://www.metal3d.org/ticket/adieu-teamviewer
    jdh outil
  • #RGPD : 10 recommandations de sécurité informatique - Open-Freax
    Quelques recommandations sur comment sécuriser informatiquement son entreprise. Arriver à un niveau pareil peut-être difficile, mais il est selon moi important de faire quelque chose à son niveau (il vaut mieux quelques règles simples que rien du tout). Cet article donne de bonnes idées là dessus
    Fri Dec 1 21:30:34 2017 - permalink -
    QR-Code
    - https://open-freax.fr/rgpd-10-recommandations-securite-informatique/
    recommandations sécurité
  • Quelles sont les raisons de boycotter Microsoft
    Pas grand chose à ajouter franchement. Je retravaille sur windows depuis 8 mois pour ma plus grande peine malheureusement. Sans parler de Azure qui n'est nettement pas à la hauteur des autres cloud (niveau fiabilité, ergonomie et usabilité)
    Thu Nov 30 11:37:01 2017 - permalink -
    QR-Code
    - http://www.sebsauvage.net/wiki/doku.php?id=microsoft
    evil microsoft
  • Welcome to Python cheatsheet! — pysheeet
    Cheat sheets sur plein de trucs en Python. Peut servir
    Wed Nov 29 22:11:53 2017 - permalink -
    QR-Code
    - https://www.pythonsheets.com/
    cheatsheet python
  • Positive Technologies - learn and secure : Random Number Security in Python
    Nombre aléatoire et sécurité en Python, avec quelques conseils pour sécuriser son serveur web.
    Tue Nov 28 17:38:05 2017 - permalink -
    QR-Code
    - http://blog.ptsecurity.com/2012/10/random-number-security-in-python.html
    python sécurité
  • I'm doing 100+ projects in Python to learn the language. Thought someone else might want to do the same. : learnpython
    Un portfolio de projets (simples ou moins simples) à faire pour se perfectionner en Python. Peut se faire avec un autre langage.
    From Pwass: shaarli.nicolas-cellier.net.
    Wed Nov 22 10:43:45 2017 - permalink -
    QR-Code
    - https://www.reddit.com/r/learnpython/comments/1huuqk/im_doing_100_projects_in_python_to_learn_the/
    english learning python
  • À quoi servent les différents répertoires & points de montage Linux
    Explication sur les différents répertoires Linux. À garder
    Thu Oct 26 16:36:23 2017 - permalink -
    QR-Code
    - https://buzut.fr/points-de-montage-linux/
    linux
  • 7 reasons why Azure might beat AWS in the cloud wars
    Ou pourquoi Azure pourrait battre AWS dans la guerre des Cloud. Articles qui se focalisent uniquement sur les aspects non techniques, ce qui est intéressant (car meme si j'ai beaucoup bossé sur Azure et peu sur AWS, ce dernier est pour moi largement supérieur niveau technique). Mais on sais tous que ce n'est pas forcément l'aspect technique qui est primordial pour le choix d'une technologie dans un contexte de grande entreprise...
    Après il n'y a pas vraiment de 'gagnant', ni de 'guerre'. Tout domaine informatique évolue très vite, on l'a toujours vu, et une technologie qui semble en monopole à un moment peut toujours etre remplacé (bon, ok, à paart windows pour le moment). C'est d'autant plus vrai pour moi qu'avec le Cloud, il est beaucoup plus facile d'avoir la main sur son infra, et donc de la changer rapidement, ce qui est moins le cas pour un infra on-prem.
    Thu Oct 12 10:46:28 2017 - permalink -
    QR-Code
    - https://www.linkedin.com/pulse/7-reasons-why-azure-might-beat-aws-cloud-wars-has-nothing-goswami/
    cloud english
  • Entrepreneur d'Intérêt Général
    Appel à candidature pour des projets d'utilité publiques proposées par différentes administrations. Ça a honnêtement l'air vachement cool ! Je vous laisse regarder tout ça, mais dommage que je ne sois pas en France pour candidater. Peut-être l'année prochaine.
    Wed Oct 11 22:21:55 2017 - permalink -
    QR-Code
    - https://entrepreneur-interet-general.etalab.gouv.fr/
    société
  • TIAD Camp Docker : Retour sur la journée D2SI Blog
    Retour intéressant sur la journée sur Docker organisée par D2SI, SSII sur Paris. Les expériences sont vraiment intéressants. Bon par contre, moi qui veut me mettre plus là-dedans, ça me montre que j'ai encore des trucs à apprendre... Bard, ça viendra
    Wed Oct 11 22:19:05 2017 - permalink -
    QR-Code
    - http://blog.d2-si.fr/2017/10/11/tiad-camp-docker-retour-journee/
    devops docker
  • Current state automated Machine Learning
    Petite description de ce qu'est l'auto Machine Learning et des principales librairies pour en faire. Le principe ? Laisser une librairie trouver les meilleurs algorithmes et paramètres pour établir un modèle. C'est une idée à laquelle j'avais déjà réfléchi en tant qu'informaticien s'intéressant à la Data-Science. Pourquoi s'embeter à tester différents paramètres quand on peut automatiser le tout ? Avec, à la clé, un gain de temps pour le data-scientist qui peut passer son temps sur des algorithmes autrement plus compliqués. À voir comment cela évoluera dans le futur.
    Fri Sep 22 15:21:57 2017 - permalink -
    QR-Code
    - http://www.kdnuggets.com/2017/01/current-state-automated-machine-learning.html
    datascience english machine-learning
  • How to Avoid the 'Seven Deadly Sins' of a Level 2 PMO Published: 29 December 2016 ID: G00314156
    Un article de Gartner expliquant les erreurs à éviter en tant que chef de projet informatique. Assez intéressant, mais ne s'applique qu'aux grosses boites, quand le Business est impliqué. Pas applicable à toute situation du coup, mais pas mal de choses sont intéressantes e tpeuvent etre reprise.
    Tue Sep 19 14:13:30 2017 - permalink -
    QR-Code
    - https://www.gartner.com/doc/reprints?id=1-48SFTCU&ct=170803&st=sb#dv_5_for_eight
    english gestion-projet
  • How to support full Unicode in MySQL databases · Mathias Bynens
    Petit truc qui m'a bien saôulé ce week-end, du coup je m'explique.
    De puis la dernière mise à jour de mon blog sur le jonglage (jonglage.bwatt.eu), les accents des derniers articles uploadés apparaissent bizarrement. En gros, problème d'encoding.
    Après un petit test, pas de souci quand je lance le code directement en local, mais sur mon environnement de dev, oui. Point commun avec la prod ? Ça tourne sur Docker. Le code n'est donc pas en cause.
    Après avoir fouillé un moment, je me suis aperçu que ma mariadb sur Docker n'était pas en utf8, mais en latin1 ! Et il semble que ça soit la configuration par défaut de mariadb (je ne comprend pas qu'on puisse avoir ça par défaut). Quand on installe par les paquets sur archlinux ou sur Lint, c'est assez intelligent pour mettre en utf8. Mais il semble qu'ils aient oublié de faire ça sur la dernière image Docker...
    La solution ? Relancer mariadb avec des flags pour être en utf8 (mysqld --character-set-server=utf8mb4 --collation-server=utf8mb4_general_ci --character-set-client-handshake=FALSE). Ou plutôt en utf8bm4. Car j'ai après dû changer l'encodage de mes tables et database en utf8, et suis tombé sur ceta rticle, expliquand qu'il faut utiliser utf8bm4 et non utf8. Je poste ça donc ici.
    Mon Sep 18 22:21:07 2017 - permalink -
    QR-Code
    - https://mathiasbynens.be/notes/mysql-utf8mb4
    astuce database docker
  • Comment utiliser drone-ci pour tester vos images docker ? - (Debian/Ubuntu) · Blog de Victor Hery
    Automatisation de build et de tests sur Docker avec Drone. Peut être utile.
    Wed Aug 16 08:01:15 2017 - permalink -
    QR-Code
    - https://blog.victor-hery.com/2017/07/build-et-test-custom-image-drone-ci.html
    devops docker
  • Les agriculteurs hackeurs du Nebraska
    Les agriculteurs font de la résistance au Nebraska contre les grandes firmes. Au programmes de celles-ci : verrouillage des logiciels des tracteurs, brevets à gogo, et récupération à tout va de big-date dans le but à terme de remplacer l'humain. Encore une fois où je n'approuve pas l'usage non éthique des big-data, même si c'est mon boulot (quant aux brevets, n'en parlons pas). Assez moche mais au moins les gens essaient de s'organiser contre eux. Affaire à suivre
    Mon Aug 14 10:23:54 2017 - permalink -
    QR-Code
    - http://mobile.lemonde.fr/pixels/visuel/2017/08/08/agro-hackeurs-du-nebraska_5170156_4408996.html
    agriculteur big-data brevet
  • SOAT Blog » Apache Kafka – Genèse, Concepts et Fonctionnement du message-broker du big-data
    Une assez bonne description de Kafka, outil de messaging en train de prendre une place prépondérante dans le monde Big-Data
    Tue Aug 8 18:24:37 2017 - permalink -
    QR-Code
    - http://blog.soat.fr/2017/04/apache-kafka-concepts/
    big-data outil
  • Python Mock Gotchas - Alex Marandon
    Autre article sur les Mocks en Python, avec quelques erreurs courantes expliquées.
    Wed Jul 5 14:04:51 2017 - permalink -
    QR-Code
    - http://alexmarandon.com/articles/python_mock_gotchas/
    how-to python test
  • Real Life Mocking - The Engine Room
    Comment utiliser la librairie Mock pour des usages un peu poussés. Cette librairie permet de simuler certains appels de fonctions en Python, ce qui est très utile pour implémenter des tests unitaires qui requiert des appels à des systèmes externes. Ici, l'auteur explique comment simuler les appels HTTP à une API externe, et ainsi ne plus dépendre de si elle est disponible ou pas pour que nos tests fonctionne.
    Pour les intéressés, l'article donne un lien vers un article plus simple sur Mock.
    Wed Jul 5 11:49:33 2017 - permalink -
    QR-Code
    - http://engineroom.trackmaven.com/blog/real-life-mocking/
    how-to python test
  • Stream Processing and Probabilistic Methods: Data at Scale
    Description des différents moyens de traiter des streams de manière probabiliste. Les méthodes classiques sont en effet parfois trop lourdes et requiert plus de mémoire. Ici, on ne s'attache pas à l'exactitude des résultats, mais à en faire une approximation. La plus célèbre de ces méthodes étant le bloom filter (déjà évoqué dans un précédent article)
    Wed Jul 5 11:37:18 2017 - permalink -
    QR-Code
    - http://bravenewgeek.com/stream-processing-and-probabilistic-methods/
    probabiliste stream
  • Paxos made live
    Un papier de Google décrivant la difficulté à mettre en oeuvre le protocole Paxos (ici utilisé pour développé Chubby, un système par GFS et Big Table). Comme auoi, de la théorie à la pratique il y a toujours un gap (car Paxos lui même est très bien documenté). La difficulté majeure, selon les auteurs, est qu'il n'y a pas assez d'outils créés par la communauté des algorithmes fault-tolerance, et que du coup il est très dur de tester et développé dessus.
    Papier un peu long et ardu (un papier de recherche quoi), mais je commence à m'intéresser de plus en plus aux papiers : les articles c'est bien, mais ne suffisent en général pas dès qu'on veut vraiment rentrer dans le détail. Après, se manger un PDF d'une quinzaine de pages, avec quasiment pas de schémas, ca prend du temps il faut bien l'avouer... Pour les plus motivés du coup.
    Thu Apr 20 16:02:05 2017 - permalink -
    QR-Code
    - https://static.googleusercontent.com/media/research.google.com/de//archive/paxos_made_live.pdf
    distribué paxos
  • Big Data : les histoires d’Hadoop finissent mal (en général)
    Pourquoi les architectures Big-Data finissent par échouer en général. Un truc que j'avais déjà entendu il y a peu (par Gartner, qui a sorti que 70% des projets échoueront cette année !). C'est vrai que c'est un truc que j'ai souvent vu : des projets qui ne passent jamais l'étape du PoC. À cela plusieurs raisons selon moi :
    - qui dit Big-Data dit Big-Architecture. Et donc difficile à maintenir. Un PoC ça va, mais maintenir ensuite demande du temps, des compétences, des gens et de l'argent. Ce que les entreprises ne sont pas prêtes à mettre
    - ce qui amène au deuxième point : le manque de formation. Les projets sont en général faits par des externes qui maitrisent le sujet, et il y a peu de passation de connaissance. Que ce soit la faute de l'un ou de l'autre. Du coup, on se retrouve souvent avec des gens qui quand ils doivent s'éloigner d'une procédure établie, où on leur a donnée chaque commande, sont perdus. Le mieux est selon moi d'intégrer un interne lors du développement du projet afin qu'il puisse se faire la main dessus. Et ça, c'est rarement fait (par manque de temps, de budget, et à cause du "on verra bien plus tard" Trop tard souvent)
    - les projets sont trop aboutis. La faute au effet hype (avec des articles qui promettent monts et merveille) et des boites qui mettent des étoiles dans les yeux des clients pour réussir la vente. Sauf qu'il faut ensuite réaliser le produit, et que ça s'avert beaucoup moins performant qu'annoncé, ce qui décoit le client. Les prestataires se disent que si elles ne font pas cela, elles n'auront pas de projets, mais c'est faux : une personne technique d'une boite sera toujours rassuré quand on lui dit qu'on va d'abord mettre un truc simple en place pour voir, et qu'ensuite on avisera (et c'est ces personnes-là qu'il faut viser !). C'est selon moi la meilleure façon de procéder : d'abord résoudre un problème que les gens ont, avec un projet simple, ce qui mettra le client en confiance, et lui donnera ensuite envie de signer pour plus gros (et le fidélise donc !). Personne n'a envie de tout changer d'un coup (surtout dans une grande entreprise, qui sont la majorité des clients en Big-Data !), donc l'approche petit à petit donne une chance de réussir, alors qu'un gros changement a toutes les chances d'échouer (quelque chose pour moi qui est très vrai dans beaucoup de situations).
    Tue Apr 11 20:52:30 2017 - permalink -
    QR-Code
    - http://www.silicon.fr/big-data-histoires-hadoop-finissent-mal-en-general-172035.html
    big-data réflexion
  • Oui, Illico ! - LinuxFr.org
    Outil de nettoyage sur lequel je suis tombé. À tester un de ces quatre.
    Tue Apr 11 20:51:32 2017 - permalink -
    QR-Code
    - https://linuxfr.org/news/oui-illico
    data outil
  • 5 services que systemd m’a déjà rendu | OCTO talks !
    Description des possibilités offertes par systemd, ça a l'air assez intéressant ! J'ai déjà une petite idée de comment l'utiliser. Je sais que systemd a fait couler pas mal d'encre, mais je pense que le débat était un peu inutile, il y a d'autres trucs sur lequels se prendre la tête. Et actuellement, la majorité des distributions l'ont adoptés, c'est donc que ça finit quand même par faire consensus (et init.d avait vraiment besoin d'un rempllaçant).
    Tue Apr 11 20:49:29 2017 - permalink -
    QR-Code
    - http://blog.octo.com/5-services-que-systemd-ma-deja-rendu/
    linux outil
  • Jepsen: MongoDB 3.4.0-rc3
    MongoDB ne perd plus de données ! Alors que depuis le début, Mongo était réputé pour perdre des données (à tel point aue je le déconseillais systématiquement), l'équipe a fait de gros efforts pour stabiliser le système, à tel point que Mongo passe désormais le Jepsen Test (LE test à suivre pour connaitre la stabilité d'une base de donnée distribuée). Comme quoi il faut mieux lancer une base instable mais sexy et avec beaucoup de fonctionnalités, et ainsi attirer beaucoup d'utilisateurs dès le début, plutot que de construire quelque chose de fiable, mais qui prendra beaucoup de retard. C'est amoral mais bon...
    En tout cas, j'ai un certain nombre de nouveaux papiers/articles à lire sur la consistence et la Linearizability (EDIT: qui est en fait l'atomicité en francais. Je viens de comprendre plein de trucs d'un coup...) maintenant... À suivre
    Tue Apr 11 14:30:22 2017 - permalink -
    QR-Code
    - http://jepsen.io/analyses/mongodb-3-4-0-rc3
    bigdatahebdo database
  • GitHub - facebookresearch/visdom: A flexible tool for creating, organizing, and sharing visualizations of live, rich data. Supports Torch and Numpy.
    Librairies de visualisation en Python. Pratique pour du prototypage apparamment. À tester éventuellement (fournis par Pwass : http://www.nicolas-cellier.net/ et shaarli.nicolas-cellier.net)
    Wed Mar 29 18:44:45 2017 - permalink -
    QR-Code
    - https://github.com/facebookresearch/visdom
    datavisualition librairie python
  • Roadmap Linux, Docker et stratégie open source sur Azure
    Un article sur la stratégie Open-Source chez Azure. Pas très poussé, mais il y a des éléments intéressants.
    Wed Mar 29 14:57:43 2017 - permalink -
    QR-Code
    - https://www.infoq.com/fr/articles/linux-docker-azure-jose-miguel-parella
    azure cloud open-source
  • Raft Consensus Algorithm
    Description de l'algorithme Raft, permettant de faire du consensus entre plusieurs serveurs (et utilisé par cockroachDB). Similaire à Paxos (que je compté étudier prochainement).
    Tue Mar 28 18:20:21 2017 - permalink -
    QR-Code
    - https://raft.github.io/
    algorithme big-data
  • Google Spanner Inspires CockroachDB To Outrun It
    La version Open-Source de Spanner (évoqué dans l'article précédent). Pas aussi efficace, bien sûr (car eux ne maitrise pas le hradware), mais quand même. L'article évoque notamment les différences majeures entre les deux outils.
    Mon Mar 27 21:52:32 2017 - permalink -
    QR-Code
    - https://www.nextplatform.com/2017/02/22/google-spanner-inspires-cockroachdb-outrun/
    big-data outil
  • Spanner, TrueTime & The CAP Theorem
    Un article tiré d'un des derniers bigdatahebdo sur spanner, le dernier-né dans la galaxie big-data chez Google Cloud. Il s'agit d'un des papiers blances qu'ils publient régulièrement. Un peu ardu, mais pas trop long pour une fois, donc accessible.
    Spanner est un outil voulant réconcilier Big-Data et SQL, avec des possibilités énormissimes. Google a notamment réussi à contourner le fameux CAP théorème, grâce à une alliance de Hardware et de Software. Il n'y a qu'eux pour réussir un truc pareil (il n'y a pas grand monde qui maitrise aussi bien ces deux aspects). Pour la petite histoire, cela s'est notamment fait en installant des horloges atomiques dans leurs datacenters...
    Mon Mar 27 21:47:53 2017 - permalink -
    QR-Code
    - https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45855.pdf
    big-data bigdatahebdo google
  • BigData Hebdo
    Un podcast fait sur le big-data par mon ancien chef et un de ses amis. Ils rassemblent des articles de news sur le big-data, et les aborde en les analysant. Un très bon moyen de se tenir au courant du monde du big-data !
    PS : dorénavant, tous les articles provenant de ce podcast seront taggés bigdatahebdo
    Mon Mar 27 21:46:14 2017 - permalink -
    QR-Code
    - http://bigdatahebdo.azurewebsites.net/
    big-data podcast
  • Réduire les temps de développement sans sacrifier la qualité - LinuxFr.org
    Un article sur la manière de conduire un projet pour ne pas perdre trop de temps. Je n'adhère pas à tout, mais il y a des idées intéressantes, qui rejoignent certaines choses que j'avais déjà tirée de ma (modeste) expérience à développer des projets. J'aime bien notamment tout ce qui incite à ne pas en faire trop. C'est vrai qu'en tant que développeur on a tendance à vouloir faire un outil super élégant, modulable et avec pleins de fonctionnalités. Sauf que à la fin le client finit toujours par n'en utiliser que la moitié. Mieux vaut se concentrer sur le périmètre et la documentation, quitte à avoir un outil un moins adaptable, et dont on est moins fier, "codiquement" parlant. Mais ça fait gagner tellement de temps.
    Fri Feb 24 09:54:24 2017 - permalink -
    QR-Code
    - http://linuxfr.org/users/lebouquetin/journaux/reduire-les-temps-de-developpement-sans-sacrifier-la-qualite
    développement gestion-projet
  • ExplainShell, un outil pour expliquer une commande Linux - Informatique générale - ShevArezo`Blog
    Un outil qui va parcourir les MANs pour expliquer une commande Linux (trouvée sur internet par exemple). Peut-être pratique, je le garde là.
    Fri Feb 24 09:53:17 2017 - permalink -
    QR-Code
    - http://blog.shevarezo.fr/post/2017/02/23/explainshell-outil-expliquer-commande-linux
    command-line linux outil
  • « Que faut-il pour XXX ? » « Du logiciel libre ! » Non, une gouvernance éthique !
    Une critique du "tout" logiciel libre, prônant plutôt d'aller vers la gouvernance éthique. Bah oui, vous pouvez avoir une entreprise qui utilise uniquement de l'open source, mais derrière ne dit rien de ce qu'elle fait derrière. Donc ça ne suffit pas (ça rejoint un peu ce que fait Framablog). Sans rejoindre trop le fait de se passer du logiciel libre, c'est vrai que ce n'est plus l'unique objectif. Il faut aussi voir ce qu'il y a derrière. C'est marrant, je tombe de plus en plus sur des "critiques" du logiciel libre en ce moment, ce que je trouve pas mal. C'est ce qui permet de le remettre en question, et ainsi faire évoluer la question. Sachant que si on ne fait pas ça, on tombe dans le fanatisme, ce qui est quelque chose que je déteste (quel que soit la thèse défendue).
    Fri Feb 24 09:48:55 2017 - permalink -
    QR-Code
    - https://blog.imirhil.fr/2017/02/21/logiciel-libre-gouvernance-ethique.html
    open-source réflexion
  • GrapheekDB : Base graphe en Python - Raphaël Braud - Nidus
    Une nouvelle base graphe en pure python. À garder sous le coude, ça peut être intéressant !
    Fri Dec 9 21:52:04 2016 - permalink -
    QR-Code
    - http://www.nidus.fr/blog/grapheekdb-base-graphe-python/
    database graphe python
  • Sortez vos capacités - LinuxFr.org
    Article sur les condensateurs
    Tue Nov 29 22:54:53 2016 - permalink -
    QR-Code
    - https://linuxfr.org/users/niconico/journaux/sortez-vos-capacites
    condensateur électronique
  • How to Retry with Class - miguelgrinberg.com
    Un article par le créateur de Flask sur comment implémenter une politique de retry dans une application multi-micro-services, pour éviter que la mise à jour d'un deux fasse tomber toute l'application. Un article que j'aurais bien aimé avoir sous la main pour certains de mes anciens projets... Mais mieux vaut tard que jamais !
    Mon Nov 28 22:15:37 2016 - permalink -
    QR-Code
    - https://blog.miguelgrinberg.com/post/how-to-retry-with-class
    concept flask python
  • Découvrons la programmation asynchrone en Python
    Une bonne introduction à la programmation asynchrone en Python, avec toutes les nouveautés amenées dans python 3.5 (await et tout ça). Un truc sur lequel il faudra que je me penche sérieusement un jour, ça doit faire gagner pas mal de temps. Je garde ça en tête
    Mon Nov 21 20:36:15 2016 - permalink -
    QR-Code
    - https://zestedesavoir.com/articles/1568/decouvrons-la-programmation-asynchrone-en-python/
    asynchrone concept python
  • Services et tests d’intégration : ce qu’il faut savoir pour que ça se passe bien | OCTO talks !
    Une description détaillée de comment mener des tests d'applications sur une architecture complexe avec de nombreux services. Ce que j'aime bien, c'est qu'ils parlent pas mal des problèmes humains, sans se concentrer uniquement sur le technique comme beaucoup d'articles. De plus, ils utilisent beaucoup la règle du "ça prend du temps au début, mais ça en fait gagner sur le long terme", règle que peu de décideurs sont prêts à entendre, voulant toujours paré au plus pressé, ce qui finit par donner des projets interminables.
    Thu Nov 17 13:37:51 2016 - permalink -
    QR-Code
    - http://blog.octo.com/64480/
    bonnes-pratiques devops test
  • Understanding the Bias-Variance Tradeoff
    Pour comprendre le compromis biais-variance (l'une des choses les plus importantes en Machine Learning).
    Fri Oct 21 16:33:25 2016 - permalink -
    QR-Code
    - http://scott.fortmann-roe.com/docs/BiasVariance.html
    data-science english explications machine-learning
  • Qu'est ce qu'il se passe quand on ouvre une page web
    Une description pas à pas des différentes étapes qui se produisent quand on ouvre une page web. Très bonne vulgarisation, qui ne rentre pas trop dans les détails techniques.
    Fri Oct 21 14:19:20 2016 - permalink -
    QR-Code
    - https://iloth.net/2016/10/ce-quil-se-passe-quand-on-ouvre-une-page-web/
    explications web
  • Lifemap
    Ça fait longtemps que je n'avais pas posté une bonne vieille datavisualisation. C'est désormais chose faite avec cette belle carte du vivant réalisée par l'université de Lyon.
    Sun Oct 9 13:24:56 2016 - permalink -
    QR-Code
    - http://lifemap.univ-lyon1.fr/
    dataviz
  • Santé : ce que préparent les géants du numérique
    Comment le big-data va révolutionner la santé ("La rencontre du BigData et de la santé ouvre un cycle d’innovations sans précédent. On est dans le même type de saut vertigineux que la découverte des antibiotiques"). C'est sûr que ça va changer pas mal de choses. Après, il y a aussi beaucoup de risques, comme l'indique l'article. Si les assureurs commencent à jouer avec nos données de santé, ça va faire mal... Et ne me dites pas que les données sont sécurisées : quand on voit le désastre niveau sécurité informatique dans lequel on est, avec scandales à répétition, on est mal barré
    Sun Sep 18 15:19:36 2016 - permalink -
    QR-Code
    - https://www.franceinter.fr/societe/bigdata-et-sante-une-chance-ou-une-menace
    big-data santé
  • Un guide illustré pour enfant de Kubernetes
    Un petit guide bien fait avec bande dessinée à l'appui pour expliquer le fonctionnement de Kubernetes. Même si ce n'est pas trop mon domaine, je suis toujours intéressé par ce qui touche à l'automatisation, et notamment Docker (sur lequel tourne ce shaarli), et je compte bien un jour passer à Kubernetes et faire tourner tous mes conteneurs dedans.
    Tue Jul 26 18:18:23 2016 - permalink -
    QR-Code
    - https://deis.com/blog/2016/kubernetes-illustrated-guide/
    automatisation docker explications kubernetes
  • Artisan développeur - GBProd
    Une description du concept d'artisan développeur : l'auteur fait une analogie entre le métier d'artisan de son père et de son grand père et son propre métier de développeur. On y voit que développeur n'est pas forcément si un métier à part que ça. Entre outre, cela fait une bonne description de ce qu'est un bon développeur selon moi.
    Mon Jul 25 16:45:17 2016 - permalink -
    QR-Code
    - http://gb-prod.fr/2016/06/12/artisan-developpeur.html
    concept developpeur
  • YouTube thumbnail
    PyData Paris 2016 - Python and Big Data: a good match? - YouTube
    La vidéo de ma présentation sur Python et Big Data à pydata 2016. Ok, mon accent est pas terrible mais c'est ma première présentation dans un évènement de cette envergure !
    Pour résumer, j'explique en quelques points pourquoi Python me semble être un excellent langage pour faire du Big-Data.
    Tue Jul 5 14:37:11 2016 - permalink -
    QR-Code
    - https://www.youtube.com/watch?v=lVmlTOdVRok
    big-data conference fierte python
  • Educalab devient EdFab, la fabrique des nouvelles formations numériques. | Cap Digital
    Une nouvelle structure du pôle de compétitivité Cap Digital spécialisé dans le numérique, spécialisé dans les formations numériques, et dont un ancien collègue vient de prendre la tête. Si vous avez besoin de formations dans le numérique, ou de d'aide pour donner les vôtres, n'hésitez pas à aller voir de ce côté !
    Sat Jun 18 14:34:48 2016 - permalink -
    QR-Code
    - http://www.capdigital.com/edfab/
    formation numérique
  • Rachat de LinkedIn par Microsoft
    Une réflexion sur le rachat de LinkedIn par Microsoft, avec les dérives que cela peut entrainer. J'adore mon boulot et tout ce que Big-Data, mais comme toute nouvelle technologie, il ne faut pas oublier les risques de dérive possible...
    Thu Jun 16 15:17:34 2016 - permalink -
    QR-Code
    - http://www.affordance.info/mon_weblog/2016/06/digital-labor-microsoft-linkedin.html
    big-data fr réflexion
  • Une carte des compétences d'un datascientist
    Un vieux lien qui traine mais mérite d'être animé. Il représente une carte des compétences que doit avoir un datascientist, selon plusieurs axes. Un peu extrême dans le sens où il est impossible d'avoir toutes ses compétences, et où les domaines commencent à se séparer (mais le lien est un peu vieux aussi, 2013 !). Néanmoins il donne une idée de ce que peuvent être les prérequis.
    Thu Jun 16 10:29:19 2016 - permalink -
    QR-Code
    - http://nirvacana.com/thoughts/becoming-a-data-scientist/
    compétences datascience
  • Journal du hacker
    Un bon flux pour récupérer des news sur ce qui se passe dans le monde du hack. On y trouve pas mal d'informations sur Linux, Docker, Mozilla... Entièrement francophone.
    Mon Jun 13 12:26:51 2016 - permalink -
    QR-Code
    - https://www.journalduhacker.net/
    hacker news
  • OpenStack : Panorama | WeScale Blog
    Une explication de l'architecture OpenStack, permettant de crééer soi-même son Cloud privé, avec des descriptions module par module. Une bonne introduction pour avoir une idée de comment ça marche.
    Mon Jun 13 12:25:04 2016 - permalink -
    QR-Code
    - http://blog.wescale.fr/2016/05/18/openstack-panorama/
    cloud concept
  • PyData Paris 2016 |
    Un évènement portant sur python et la donnée. Au programme : conférences, tutoriaux et rencontres en tout genre. Avec en prime, un talk présenté par votre serviteur sur python et le Big Data !
    Mon Jun 13 12:22:38 2016 - permalink -
    QR-Code
    - http://pydata.org/paris2016/
    conference data python
  • Write Less Code · Code Ahoy
    'the best code is no code at all'
    Pour avoir dû repris du code complètement obsfusqué avec pleins de classes inutiles dans tous les sens, je suis complètement d'accord. Surtout que c'était en Python (qui est quand même fait pour écrire du code lisible à la base). Quand vous écrivez du code, PENSEZ TOUJOURS à Bernard (Bernard étant le nom générique du mec qui va reprendre votre code).
    via http://sebsauvage.net/links/?xJLq8Q
    Tue Jun 7 12:37:23 2016 - permalink -
    QR-Code
    - http://codeahoy.com/2016/06/03/write-less-code/
    bonnes-pratiques programmation
  • beta.gouv.fr
    Dans la même lignée que le dernier lien, un site recensant les nouvelles applications développées par des personnes de l'administration (j'ai vu une conférence d'un des développeurs au Devoxx qui m'a donné envie d'aller voir). En gros, au lieu de mettre 10000 ans à pondre un énorme site mal foutu façn administration, le but est de lancer pleins de mini-projets sous forme start-up pour avoir un prototype en 6 mois, et ensuite consolider si besoin. Au menu : une application pour consulter les droits auxquels on a besoin de manière anonyme, une pour faire une demande de bourse, d'autres pour aider les handicapés ou les retraités... Pour une fois qu'on va dans le bon sens, j'applaudis des deux mains !
    Tue May 3 16:25:09 2016 - permalink -
    QR-Code
    - https://beta.gouv.fr/
    etat modernisation service
  • faire simple | Innovons, simplifions
    Le site de modernisation des administrations en France. Pas encore très important, mais déjà une très bonne chose que ce soit lancé ! Après avoir vu quelques conférences, j'ai l'impression qu'on va avoir du lourd niveau numérique qui arrive par l'état français. Il était temps qu'on rentre dans le 21e siècle !
    Tue May 3 16:22:01 2016 - permalink -
    QR-Code
    - http://www.faire-simple.gouv.fr/
    etat modernisation technologie
  • fish-science – Quels outils pour la publication?
    Un petit article de notre ami pwasson (mais si, vous savez, j'ai déjà posté des liens qui venaient de chez lui) sur les outils de publication. Plutôt axé scientifique, mais toujours bon à prendre !
    Tue May 3 16:16:57 2016 - permalink -
    QR-Code
    - http://www.nicolas-cellier.net/quels-outils-pour-la-publication.html
    outil publication
  • Engineers Shouldn’t Write ETL: A Guide to Building a High Functioning Data Science Department | Stitch Fix Technology – Multithreaded
    Une description de la manière d'organiser sa team de data engineers/scientists. Ne s'applique pas vraiment dans le cas chez Affini-Tech où je travaille car on est trop peu nombreux et uniquement focalisés sur la data, du coup ça aurait peu de sens. Il y a bien des domaines qui se dégagent chez les personnes, en fonction des affinités et des études, mais le but est d'être tous polyvalent.
    Cela dit, j'aime bien la manière de voir, qui donne de l'intérêt à tout le monde et décloisonne les milieux. Pour moi, il n'y a rien de pire qu'une équipe où chacun à "sa" spécialisation et ne connait rien d'autre : c'est tellement plus efficace quand on a une vision, même très succinte, du domaine des autres (notamment pour ne pas aller voir pour des bugs complètement triviaux), ça suscite de l'interaction et du respect du travail des autres.
    Fri Apr 8 11:02:19 2016 - permalink -
    QR-Code
    - http://multithreaded.stitchfix.com/blog/2016/03/16/engineers-shouldnt-write-etl/
    data organisation
  • Le Blog d'Ippon Technologies - Big Data : Panorama des solutions 2016
    Avec l'explosion des outils Big-Data, arrive l'explosion des architectures différentes. Et autant pas mal de gens arrivent à maitriser le batch, autant les autres types (streaming, lambda...) sont encore assez exotiques en dehors de grosses grosses entreprises. C'est là-dedans qu'il y a du boulot marrant du coup :)
    Tue Apr 5 16:41:11 2016 - permalink -
    QR-Code
    - http://blog.ippon.fr/2016/03/31/big-data-panorama-des-solutions-2016/
    architecture big-data
  • 8 façons inhabituelles de se faire pirater – Le Blog du Hacker
    Tout est dans le titre
    Tue Apr 5 14:47:27 2016 - permalink -
    QR-Code
    - http://www.leblogduhacker.fr/8-facons-inhabituelles-de-se-faire-pirater/
    informatique securite
  • L’évolution des bottlenecks dans l’écosystème BigData | OCTO talks !
    L'évolution des technos big-data en fonction des différents bottlenecks rencontrés. C'est ultra-intéressants de voir les différe,ts problèmes et les solutions trouvés.
    Prochain problème à régler : le fameux Grabage Collector. Un autre article là-dessus pour ceux que ça intéresse : http://blog.octo.com/la-mort-prochaine-du-ramasse-miettes/
    Fri Mar 18 12:40:52 2016 - permalink -
    QR-Code
    - http://blog.octo.com/levolution-des-bottlenecks-dans-lecosysteme-bigdata/
    architecture big-data concept
  • L’U.T.C., sous toutes les coutures. | L'Atelier de Cartographie
    Description d'une série de projets réalisée dans une matière de mon ancienne école, tous articulés autour de la thématique de mieux comprendre l'école. Extrêment intéressant et cool comme projet ! J'avais déjà réalisé la matière à l'époque (voir ici pour le projet auquel j'avais participé : http://graph.data-publica.com/ ) et l'avait trouvé passionnante. J'avais alors commencé à comprendre le potentiel de la donnée, et son utilisation dans tous les domaines. Cela est très bien illustré ici : à partir de données brutes, on peut commencer à mieux comprendre le fonctionnement des études à l'UTC (pour ceux qui veulent plus d'informations sur le projet d'étude de consommations du pic'asso, le bar à bières de l'UTC, voir ici : https://ic05-picasso.herokuapp.com/).
    Mon Mar 7 10:37:16 2016 - permalink -
    QR-Code
    - https://ateliercartographie.wordpress.com/2016/02/25/lu-t-c-sous-toutes-les-coutures/
    data graphes utc
  • Spark et SQL-On-Hadoop : vers un Hadoop augmenté
    Un peu de Hadoop, ça faisait longtemps ! C'est vrai que, travaillant actuellement moins avec cet écosystème, je tombe sur moins d'articles. L'occasion de me rattraper avec un article pointant vers un grand nombre d'autres articles centrés sur des outils de l'écosystème Hadoop. À Consommer sans modération
    Thu Mar 3 16:26:41 2016 - permalink -
    QR-Code
    - http://www.lemagit.fr/essentialguide/Spark-et-SQL-On-Hadoop-vers-un-Hadoop-augmente
    big-data hadoop
Links per page: 20 50 100
◄Older
page 1 / 2
Shaarli - The personal, minimalist, super-fast, no-database delicious clone by the Shaarli community - Help/documentation