<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>Vlog — Antonin Delpeuch</title>
    <link>http://vlog.antonin.delpeuch.eu/</link>
    <description>5 derniers articles</description>
    <generator>fugitive - http://gitorious.org/fugitive</generator>
    <lastBuildDate>2012-01-21</lastBuildDate>
    <item>
      <title><![CDATA[Mesurer la réputation]]></title>
      <link>http://vlog.antonin.delpeuch.eu/reputation.html</link>
      <description><![CDATA[
<p>Certains réseaux récents, sociaux ou moins sociaux, utilisent le concept de réputation comme « monnaie » interne, comme moteur des échanges entre leurs membres. Et l'idée fait son chemin.</p>
<p>J'ai découvert au <a href="http://fabelier.org" alt="Un hackerspace sympa" >fabelier</a> un projet intéressant, il y a quelques mois déjà : c'est <a href="http://lemnarama.org" />Lemnarama</a>. L'idée est, si j'ai bien compris, de développer un réseau social spécialisé dans les coups de main, tuyaux ou services, qui permetterait à chacun de faire connaître ses besoins, de recevoir de l'aide, et de remercier la personne en utilisant une monnaie interne, le « lemna ». Cette monnaie a plusieurs caractéristiques qui la distinguent des devises officielles. D'abord, les nouveaux inscrits reçoivent un petit pécule, pour pouvoir participer plus facilement au système. Ensuite, ils en recoivent régulièrement un peu plus. Mais surtout, c'est une monnaie fondante : quand on ne l'utilise pas, elle diminue, le but étant d'encourager les échanges et d'éviter l'épargne, qui aurait peu de sens du fait du statut symbolique de la monnaie.</p>
<p>Le but de ce système n'est pas seulement de susciter de nouveaux échanges, mais aussi de valoriser ceux qui existent déjà et qui ne sont pas mesurés économiquement, justement à cause de leur gratuité. Je précise que ce projet n'a pas été présenté dans le contexte actuel de la crise de l'euro, qui renouvelle l'intérêt pour les mécanismes monétaires : ces jours-là on parlait plutôt d'une autre monnaie, Bitcoin, qui est d'ailleurs passionnante mais qui n'a rien à voir avec mon sujet. À la fin de la présentation, un débat intéressant a eu lieu, l'intérêt d'utiliser une monnaie pour régler ces échanges étant discutable. Les gens n'ont pas eu besoin d'une monnaie pour se rendre des services bénévoles pendant des millénaires. En plus, introduire une monnaie dans ce genre d'échanges est assez artificiel et peut même être contre-productif, en déplaçant l'objectif de ces échanges dans un domaine comptable et régulé, alors qu'ils sont par essence spontanés, désintéressés, etc.</p>
<p>D'autres sites ont pourtant réussi le pari de cette drôle de compta, et le plus connu est sûrement <a href="http://stackoverflow.com" />stackoverflow</a>, un réseau de questions-réponses pour programmeurs, qui s'est étendu par la suite à d'autres domaines. Le principe est sensiblement différent des forums de discussion classiques : les différentes réponses données à une même question ne sont pas classées par ordre chronologique mais par popularité (selon l'auteur de la question, et selon les autres lecteurs), et les questions sont elles aussi notées par la communauté. Le système attribue ensuite des points aux participants pour les récompenser en fonction de la pertinence de leur intervention. Et ces points matérialisent leur réputation, qui les aide à obtenir des réponses de qualité à leur questions futures.</p>
<p>Décrit comme ça, je me rends compte que le principe n'est pas attirant du tout, mais il se trouve que le système fonctionne très bien et qu'on peut obtenir en quelques minutes des réponses de qualité sur des sujets pas triviaux.</p>
<p>Mais une ode à la notation n'est pas vraiment de bon ton ces jours-ci... La différence avec les notes financières, c'est qu'ici les points sont distribués par tous les participants, et pas une poignée d'institutions. C'est plus séduisant, quoique pas forcément beaucoup plus fiable.</p>
]]></description>
      <author>Antonin Delpeuch</author>
      <guid>http://vlog.antonin.delpeuch.eu/reputation.html</guid>
      <pubDate>2012-01-21 21:59:34.920187584 +0100</pubDate>
    </item>
    <item>
      <title><![CDATA[Vive la discrimination !]]></title>
      <link>http://vlog.antonin.delpeuch.eu/classification.html</link>
      <description><![CDATA[
<p>Je cherche toujours, pour mon projet d'algorithme de classification audio, la meilleure technique de discrimination entre plusieurs catégories.</p>
<p>Jusque là, j'utilisais un réseau de neurones. J'avais choisi cette technique principalement parce qu'elle est une des plus connues parmis les différentes méthodes d'apprentissage automatique. J'ai voulu écrire ma propre implémentation, histoire de comprendre vraiment comment ça fonctionne, et ne pas utiliser une bibliothèque préexistante comme une sorte de boîte noire magique. Je ne regrette pas ce choix, mais il a une contrepartie : maintenant, quand mon réseau ne s'entraîne pas bien, je ne sais pas si c'est à cause de la complexité du problème que je lui soumets, ou parce que mon algo d'entraînement est mauvais. L'entrainement de ce genre de bête est déjà suffisament hasardeux avec un algo fiable pour que cette difficulté supplémentaire soit de trop.</p>
<p>J'aimerais bien faire une expérience : collecter des extraits de radio de plusieurs pays différents, où on parle des langues que je ne connais vraiment pas, et voir si je peux distinguer les publicités du reste. L'idéal serait de faire le test avec plusieurs personnes, et d'avoir un moyen de savoir si les intuitions des gens sont vraies (trouver quelqu'un qui connait cette langue, en fait). Ce genre d'expérience pourrait aider à comprendre quels critères simples peuvent être utilisés pour faire un bon algorithme de discrimination. Ou au contraire, montrer que mon projet est irréalisable, si la distinction n'est pas possible sans comprendre le sens des phrases.</p>
<p>J'ai aussi découvert d'autres techniques de classification. Je connaissais déjà les machines à vecteurs de support : je ne pense pas qu'ils ajoutent grand-chose dans mon cas. On m'a conseillé l'analyse en composantes principales, mais ce n'est pas en tant que tel une méthode de classification, et les fondements mathématiques sous-jacents ne répondent pas à mon problème. Les méthodes qui utilisent des arbres de décision me semblent intéressantes : elles sont plus simples à analyser que les autres, à mon avis. On a moins cet effet <emph>boite noire</emph> qui est assez enthousiasmant à première vue (« j'ai un algo compliqué, je mets des nombres dedans et il me dit si c'est du lard ou du cochon ») mais qui est difficile à réparer quand tout ne se passe pas comme prévu. Et je n'ai pas encore regardé sérieusement du côté des algorithmes génétiques ou de <emph>boosting</emph>.</p>
<p>Il faut aussi envisager d'autres techniques, qui peuvent rapporter gros. Je pense surtout à l'utilisation de <emph>signatures audio</emph> pour détecter les jingles qui annoncent la publicité, ou carrément pour identifier chaque publicité à partir d'une base de donnée remplie de manière collaborative. Les projets qui utilisent de telles techniques sont nombreux et souvent assez réussis. C'est le cas de <a href="http://en.wikipedia.org/wiki/Shazam_(service)">Shazam</a> qui permet d'identifier un titre musical à partir de 15 secondes d'enregistrement depuis un téléphone portable, par exemple. Mais là c'est techniquement hors de portée. Par contre, le projet <a href="http://acoustid.org/">Acoustid</a> semble plus accessible. Le code est ouvert, en plus.</p>
<p>La suite du développement sera donc probablement orientée dans cette direction : implémenter un système de signature audio, simple et sans prétention, qui soit juste assez fiable pour reconnaître un petit ensemble de jingles pour une radio donnée. Si ça fonctionne, le résultat final peut être beaucoup plus fiable qu'avec un algorithme de classification générique.</p>
]]></description>
      <author>Antonin Delpeuch</author>
      <guid>http://vlog.antonin.delpeuch.eu/classification.html</guid>
      <pubDate>2011-09-04 14:30:53.763574750 +0200</pubDate>
    </item>
    <item>
      <title><![CDATA[Hackerspaces berlinois]]></title>
      <link>http://vlog.antonin.delpeuch.eu/hackerspaces-berlinois.html</link>
      <description><![CDATA[
<p>Profitant de mon séjour à Berlin pour un mois de cours d'allemand, j'ai entrepris un petit tour des hackerspaces locaux, qui sont référencés sur <a href="http://hackerspaces.org">hackerspaces.org</a>. Je note ici mes impressions à chaud.</p>
<h2>Hackers Lounge</h2>
<p>Ce n'était pas vraiment un hackerspace, mais plutôt un bar qui organisait une soirée hacking tous les mardis à partir de 20h. Le bar est situé dans Berlin est, près de la Karl Marx Allee (tout un programme !) et ressemble, vu de l'extérieur, à un bâtiment abandonné, un squat. À l'intérieur, ambiance sombre et un peu enfumée, trash sur les bords. Affiches de tous genres, mais toutes avec un message politique : visiblement en faveur d'une organisation antifasciste.</p>
<p>Quand je suis arrivé, deux personnes utilisaient des ordinateurs mis à disposition dans le bar (ce qui ne semblait pas être spécifique à cette soirée), et 2 - 3 personnes regardaient le JT sur un autre ordinateur. Pas un mot pendant plusieurs minutes. À la fin du journal, le maitre des lieux, un geek sans âge car très barbu, a embrayé sur un reportage sur la Corée du Nord. C'était très intéressant de regarder ce reportage là-bas, puisqu'il entrait en résonnance avec l'histoire de la ville. On voyait par exemple quelques images du métro de Pyongyang : les trains qui circulaient à l'époque du tournage du reportage (que je n'ai pas bien indentifiée) ont été rachetés à Berlin Est après la réunification, d'après ce que j'ai compris.</p>
<p>La soirée a continué avec l'arrivée d'un homme qui traînait dans un sac l'unité centrale de son ordinateur. La machine était infectée par un trojan qui lui demandait de l'argent pour déverouiller son ordinateur. La solution n'était pas longue à trouver : remplacer son Windows par un Ubuntu tout neuf. Un mec avait un portable sous Windows et en a profité pour installer Ubuntu dessus, comme ça avait l'air cool. Le hackers lounge était en fait une sorte d'install-party improvisée.</p>
<p>On a un peu discuté de ce qu'on faisait par ailleurs. Donc de programmation. Quand je lui ai dit que je m'intéressais à la calculabilité, le barman m'a demandé si je connaissais brainfuck : on parlait bien le même langage ! (malgré leur allemand un peu trop idiomatique pour moi).</p>
<h2>Chaos Communication Camp</h2>
<p>Il s'est trouvé que le Chaos Communication Camp avait justement lieu cette année. C'est un évènement assez important organisé par le CCC (Chaos Computer Club) une fois tous les quatre ans. Le concept est simple : pendant cinq jours, des hackers du monde entier se retrouvent dans un camp, et participent à des ateliers, écoutent des conférences, réalisent des projets, ou discutent tout simplement. L'ambiance est à la hauteur de l'évènement, qui est unique dans son genre.</p>
<p>On a la possibilité, entre autres, de participer à des rencontres où chacun présente un de ses projets en moins de 5 minutes : c'est très intéressant, et ça laisse entrevoir la diversité des profils qui se reconnaissent comme hackers. L'un présente une plateforme de traitement de texte collaboratif qu'il a réalisé pour son université, l'autre explique sa passion pour la préparation de cocktails, un autre encore raconte son voyage en Afrique pendant lequel il a appris à des élèves à utiliser Linux, ou présente son projet d'exploration lunaire (véridique !)…</p>
<p>J'ai donc découvert beaucoup de hackerspaces différents. Le plus impressionant était peut être Hx2, une communauté néerlandaise qui organisait beaucoup d'ateliers autour de l'électronique (comment souder, comment utiliser Arduino, ou des trucs plus poussés), qui avait installé une radio qui a diffusé pas mal de trucs pendant toute la durée du camp, et qui faisait plein d'autres trucs très cool. J'ai aussi fait la connaissance des gens de l'Electrolab, un hackerspace parisien que je n'avais pas encore eu l'occasion de tester (aussi parce qu'ils sont orientés électronique et que c'est pas trop ce qui me botte le plus à la base).</p>
<h2>Nerdcafe @ vetomat</h2>
<p>Un autre sorte de Stammtisch entre hackers, semblable à celle de Samacafe (Hackers Lounge), grâce auquel j'ai découvert ce second café de Friedrichshain.  L'ambiance était bonne, c'était assez drôle : faute de terrasse, les gens avaient sorti des vieux fauteuils dans la rue, une table basse, et on faisait un barbecue à côté. Idem, même genre de profils variés, assez incernables.</p>
<p>Sur le site web, le thème du jour était la sécurisation des mots de passe avec GPG, mais bon, j'ai dû louper le moment où ils en ont parlé. J'ai même pas tellement entendu de discussions techniques. Il s'agissait de discuter avec les bonnes personnes…</p>
<h2>Piraten Partei</h2>
<p>Des élections municipales vont avoir lieu début septembre et donc la ville est pleine d'affiches électorales. Dans toutes les rues, il y a des affiches accrochées aux lampadaires (il n'y a pas d'espaces réservés comme en France), et j'ai remarqué celles du Piraten Partei.</p>
<p>Je trouve ce parti assez intéressant parce que la plupart des autres pays européens n'ont pas d'équivalent à cette organisation dans leur paysage politique. Il y a bien sûr d'autres partis pirates en Europe, mais pas avec une telle visibilité et une telle maturité. En France, j'ai un peu l'impression que ça n'est qu'un regroupement de frustrés des règles de la propriété intellectuelle, mais je peux me tromper.</p>
<p>J'ai trouvé une de leurs affiches assez drôle et intéressante, et je suis donc allé au bureau du parti pour discuter un coup et voire s'ils n'en auraient pas un exemplaire pour moi. J'ai trouvé là-bas quelques personnes qui m'ont bien sûr refilé toute leur documentation, en plus de l'affiche. Je suis resorti du bureau avec le programme complet du parti : un bon exercice de compréhension écrite, avec mise au point sur les sujets chauds de l'espace politique allemand… Cool ! Reste à voir si je serai séduit par leur projet.</p>
]]></description>
      <author>Antonin Delpeuch</author>
      <guid>http://vlog.antonin.delpeuch.eu/hackerspaces-berlinois.html</guid>
      <pubDate>2011-09-04 14:25:13.813569985 +0200</pubDate>
    </item>
    <item>
      <title><![CDATA[Heuristique de classification audio]]></title>
      <link>http://vlog.antonin.delpeuch.eu/copiste.html</link>
      <description><![CDATA[
<p>Je travaille depuis maintenant plus d'un an sur un projet d'algorithme de classification audio, c'est à dire un programme qui permette de détecter automatiquement quelle est la nature d'un fichier ou d'un flux audio. L'enjeu est de faciliter l'utilisation de logiciels comme Stream Ripper qui permettent d'enregistrer les radios diffusées sur internet mais qui pêchent souvent en ce qui concerne le découpage en fichiers (surtout si la radio en question ne diffuse pas en temps réel son programme).</p>
<p>Un certain nombre de chercheurs se sont déjà penchés sur le problème et il existe aujourd'hui beaucoup de techniques pour faire cela, mais je n'ai jamais trouvé de tel algorithme implémenté de manière fonctionnelle dans un logiciel (libre). Aujourd'hui, j'ai atteint une nouvelle étape dans mon projet : l'essentiel du code nécessaire à l'apprentissage et à la détection de classes audio est opérationnel, et je suis donc en mesure de faire des tests pour déterminer concrètement à partir de quels critères on peut discriminer tel ou tel type de contenu.</p>
<p>Plus précisément, voilà ce que j'ai à l'heure actuelle : j'ai construit par dessus libVLC (le coeur de VLC Media Player) une application qui, étant donné un ensemble d'échantillons audio, les lit et en extrait les mesures dont j'ai écrit les algos. Il les exporte dans un fichier XML, en étiquetant les échantillons par leur classe. Pour mieux visualiser ces mesures, le programme permet aussi de dessiner les graphes de leurs variations au cours du temps.
Le fichier XML est ensuite envoyé à l'algorithme heuristique à proprement parler : le réseau de neurones. Ce fichier permet d'entrainer un réseau (défini dans un autre fichier) pour qu'il classifie correctement les échantillons donnés. Finalement, un programme permet de visualiser la "position" du réseau de neurones par rapport au corpus d'entrée et d'évaluer sa performance sur d'autres corpus.</p>
<p>Vous trouverez des images de mes bricolages <a href="http://antonin.delpeuch.eu/graph/index.php?album=he">dans mes albums</a> et le code est disponible <a href="http://gitorious.org/copiste">ici</a>.</p>
]]></description>
      <author>Antonin Delpeuch</author>
      <guid>http://vlog.antonin.delpeuch.eu/copiste.html</guid>
      <pubDate>2011-06-08 10:51:37.188964369 +0200</pubDate>
    </item>
    <item>
      <title><![CDATA[Sécurité et confiance]]></title>
      <link>http://vlog.antonin.delpeuch.eu/isolation.html</link>
      <description><![CDATA[
<p>Les séminaires sur <a href="http://www.college-de-france.fr/default/EN/all/cha_inf/">la sécurité informatique au Collège de France</a> s'enchaînent, et tous les intervenants finissent tôt ou tard par parler de « confiance » entre des ordinateurs, ou des entités plus abstraites. Butler Lampson n'a pas échappé à la règle, dans son exposé intitulé Usable Security Through Isolation.</p>
<p>L'idée par laquelle il a commencé est intéressante : « Things are really bad. » C'est à dire que la sécurité informatique ne doit pas reposer sur les utilisateurs, qui ne peuvent pas prendre de vraies décisions quand le système les sollicite pour accorder tel ou tel privilège à une application : le seul réflexe est de cliquer sur « OK » pour faire disparaitre la boite de dialogue.</p>
<p>Il faut donc créer des politiques de sécurité autonomes. Il préconise l'isolation : créer des contextes d'exécution séparés pour les différentes activités d'un utilisateur sur sa machine (c'est à dire en créant une machine virtuelle par catégorie d'activités, par exemple pour séparer le travail des jeux). Mais la séparation ne s'arrête pas : le monde entier doit être lui aussi séparé en deux catégories : les bons (en vert), à qui on fait confiance, et les méchants (en rouge). Les rouges étant typiquement les pirates « pakistanais. » On peut donc contrôler les communications avec des tiers, en leur permettant uniquement de parler avec la partie rouge ou verte de l'ordinateur.</p>
<p>J'avoue avoir un peu de mal à croire à l'efficacité d'une politique aussi manichéenne. Etiqueter chaque adresse IP pose beaucoup de problèmes : leur propriétaire change très souvent, et il faudrait un critère efficace pour distinguer les « bons » des « méchants. » Ou il faudrait décider d'une étiquette par défaut : la présomption d'innocence serait assez naturelle, mais du coup l'efficacité du système est très limitée. Le choix inverse rendrait l'ordinateur complètement inutilisable.</p>
<p>Les problèmes techniques ne sont pas si importants que ça, en fait. Le hic, c'est que l'utilisateur ne peut pas mettre en place sa liste de sites de confiance lui-même, c'est beaucoup trop compliqué. Je lui ai demandé comment mettre en place un tel système : pour lui, l'utilisateur devra choisir (ou acheter) une liste établie par sa banque ou une autre institution du même accabit. Pour moi, c'est impensable, ou en tout cas très dangereux. Enfin, tout dépend du niveau de sélectivité du filtre : quoi qu'il en soit, j'ai du mal à croire qu'un critère puisse être suffisamment sélectif tout en restant utilisable et acceptable par les utilisateurs. Ou alors, il faut laisser chacun faire des corrections aux listes qu'il utilise : on retombe alors dans le même problème : chaque fois que le « pare-feu » limitera l'utilisateur, il écrira une exception pour ce site.</p>
<p>Bref, la confiance selon Microsoft me laisse dubitatif.</p>
]]></description>
      <author>Antonin Delpeuch</author>
      <guid>http://vlog.antonin.delpeuch.eu/isolation.html</guid>
      <pubDate>2011-04-06 21:07:10.043334334 +0200</pubDate>
    </item>
  </channel>
</rss>

