Portail webAfriqa et le Web Sémantique

Web sémantique, ou Toile Sémantique, est une extension du Web standardisée par le World Wide Web Consortium (W3C)
Web Sémantique, ou Toile Sémantique, est une extension du Web standardisée par le World Wide Web Consortium (W3C)

Le Portail webAfriqa accueillera bientôt les visiteurs des dix sites membres par des pages de couverture Drupal. Le onzième site, BlogGuinée, lui, continue de paraître sur WordPress. Au-delà de la page d’accueil, toutefois, tous les liens continueront à pointer   pour l’instant vers les sites statiques originels. Cet arrangement conjoncturel sera graduellement remplacé par la seule version Drupal.

La publication du Portail webAfriqa sur les CMS (systèmes de gestion de contenu) Drupal et WordPress est dictée par l’évolution des technologies du Web. Elle obéit précisément à deux puissants courants:

  • Les changements et raffinements technologiques continus des normes et protocoles qui régissent le World Wide Web, sous l’égide du World Wide Web Consortium (W3C).
  • L’efficience inhérente au quatuor Linux-Apache-MySQL-PHP. Exemples: indexation automatique du contenu, moteur de recherche interne, possibilité d’intégrer le super-serveur de recherche Solr, publication multimédia (texte, son, photo, film, cartographie et GPS, localisation, internationalisation, etc.

Depuis son irruption en 1992 sur Internet —qui, lui, date de 1969— le Word Wide Web a connu une évolution en quatre phases:

  1. Le Web initial (Web 1.0), de 1992 à 1995, dominé par le langage HTML
  2. Le Web 2.0, de 1995 à 2001 avec l’introduction des styles de présentation cascadés, Cascading Style Sheets (CSS)
  3. Le Web basé sur les CMS (Content Management System), de 2001 à nos jours
  4. Le Sémantique Web, de 2008 à nos jours. Il met l’accent sur le modelage d’Ontologies et l’ingénie du savoir à l’aide de (meta)-langages tels que XML, RDF/S, OWL, SPARQL (J’y reviendrai en détail dans un prochain article intitulé “Africa and the Semantic Web”)

Une question importante se pose ici : Quel est le niveau, quantitatif et qualitatif, d’adoption de ces phases par les sites africains et guinéens  ? Il serait intéressant et utile d’enquêter et de faire le point sur la situation

Ces étapes se succèdent chronologiquement ; mais elles coexistent aussi et ne s’excluent pas mutuellement. Cela n’empêche pas qu’elles soient technologiquement très différentes les unes des autres. Chaque phase cherche à résoudre des problèmes cruciaux antérieurs. Elle s’engage à améliorer les technologies précédentes et contribue à faire évoluer sérieusement le Web en général. Cependant, chaque phase aussi apporte plus de complexité et élève ainsi le niveau requis pour l’acquisition et la compétence dans les technologies numériques de publication. De la sorte, la Phase 4 est plus complexe que la Phase 3, qui est, à son tour, plus exigente que la Phase 2, etc.

Phase 3 et webAfriqa

Etant donné leur popularité et leur solide palmarès, les plateformes Drupal et WordPress ne sont plus à présenter. La première, par exemple, supporte des méga-sites gouvernementaux (Maison Blanche, NIH, etc.) et commerciaux (The Economist, Symantec, etc.). Pour sa part, avec un taux mondial d’adoption de 27 %, la seconde trône au premier rang des quelque 3,000 Content Management Systems (y compris Drupal) disponibles sur Internet.

Comme indiqué sur Gofundme, la migration des sites du Portail webAfriqa est nécessaire mais coûteuse au triple plan technologique, matériel et financier. Sa conception et son exécution demandent du temps. En conséquence, j’ai décidé de lancer une étape initiale à deux niveaux :

  • Reconfiguration du serveur web Apache pour faire cohabiter les sites statiques avec les sites dynamiques pour chacun des noms de domaine (moins BlogGuinée, qui paraît sur WordPress) :
  1. webFuuta
  2. webPulaaku
  3. webMande
  4. webCôte
  5. webForêt
  6. webGuinée
  7. Campboiro
  8. webAfriqa
  9. AfriXML/Semantic Africa
  10. webAmeriqa
  • Dans chaque cas le site Drupal sera le conteneur extérieur. Quitte au  site classique c’est-à-dire statique, de continuer à herger le DocumentRoot ou directoire du contenu du site. Les hyper-liens de la page d’accueil Drupal pointeront donc vers le site statique, qui utilise des langages et outils “conventionnels” :  XHTML/CSS2.1, CSS, jQuery, HTML5/CSS3, Bootstrap, Google Custom Search Engine.
  • Adaptation et aménagement de sous-thèmes du type Responsive Design (Bartik, Bootstrap, Scholarly, etc.)

L’environnement Drupal

Comme indiqué plus haut, Drupal et WordPress appartiennent à l’initialisme LAMP, porte-flambeau des logiciels Open Source. Les initiales se déchiffrent comme suit :

L = Linux, le système opératoire le plus répandu sur le Web. Son noyau (kernel) supporte (a) la Pile des normes et protocoles Internet (TCP/IP) (b) diverses distributions commerciales ou libres: CentOS, Ubuntu, Red Hat, etc. Lire :

A = Apache, le serveur web (httpd) intégré à Linux. En coopération étroite avec le serveur de nom de domaine (dns), il décide de la présence ou de l’absence d’un site sur la Toile. Sa misconfiguration conduit à la panne.

M = MySQL, la base de données qui est le magasin et le cerveau de la plupart des Content Management Systems (CMS)

P = PHP, le langage de programmation qui relie la base de données MySQL et le browser, vice versa.

Drupal, lui-même, est une application composée d’un noyau  (Core) et d’additions (Contributed) tierces (modules, thèmes, libraries, script DruSH, etc.) Le site officiel de la plateforme dénombre à ce jours 36,678 Modules (fonctionalité) et 2,418 Thèmes (présentation, apparence).

Avertissement ! Si l’on filtre ces chiffres par le critère “activement mis à jour” on obtient 11,381 modules et     702 thèmes. Autrement dit, de nombreux modules et thèmes sont périmés ou obsolescents. Certains d’entre eux ne fonctionnent que sur la version 6 de Drupal, en voie d’abandon en faveur des versions 7 et 8.

A l’image de ses confrères du LAMP, Drupal est donc modulaire. Ses composantes requièrent trois types complémentaires de spécialisation:

  • Programmation : PHP, JavaScript, Python, JAVA, etc.
  • Structuration du contenu, construction et administration
  • Design, interface graphique, esthétique

Drupal est flexible, productif, sécurisé et mûr. La plateforme offre aux utilisateurs (chercheurs, businesses, publicistes, artistes, etc.,) des outils capables de transformer les idées et projets en réalité. Exemples :

  • Les modules taxonomy, rdf (Core), rdfa, rdfx, etc., résident soit dans le noyau (Core) soit parmi les Contributions (Contributed) de Drupal. Taxonomy assiste dans l’élaboration efficace et élégante de Vocabulaires, indispensables au modelage des Ontologies et à l’ingénierie savoir dans le Web Sémantique.
  • Les modules book (Core) et biblio agissent en tandem pour faciliter la création de catalogues bibliographiques et la publication de collections complètes de bibliothèques virtuelles (livres, périodiques). En cela, ils sont précieux pour le Web Sémantique. C’est avec leur aide que j’ai reproduit l’ontologie Ebola, publiée dans le format PubMed par National Institutes of Health (NIH). Pour ce faire, j’ai d’abord collecté le code de dix chiffres assigné à chaque publication. J’ai ensuite rassemblé les codes dans un fichier, à raison d’un code par ligne. J’ai enfin soumis le fichier à la base de données PubMed. En quelques secondes elle a préparé et renvoyé  des centaines de titres à Semantic Africa. Résultat : une bibliographie élaborée où tous les principaux champs sont remplis : auteur, titre, éditeur, lieu et date de publication, résumé, image de couverture, etc. Cette tâche aurait occupé une équipe humaine pendant quelques jours.
  • Le module metatag permet (a) d’intégrer le site aux moteurs de recherche et (b) de soumettre les données spécifiques à l’intention des logiciels du Web Sémantique. Il inclut Dublin Core, OpenGraph Protocol (FaceBook), Twitter Cards, Google Plus, etc.
  • Le module schemaorg ajoute à Drupal la possibilité d’intégrer les centaines de collections (personnes, évènements,  etc.) reconnues par les moteurs de recherche

webAfriqa, “Web of Documents” et “Web of Data”

Le Web Sémantique, alias Web of Data, alias Web 3.0 ne remplace pas son prédécesseur, le Web of Documents (Web 2.0). Il l’élargit, l’approfondit. Par dessus tout, il accentue la dimension collaboration, et en fait sa pierre angulaire. Les compagnies multinationales (Apple, Microsoft, Google, IBM Facebook, Amazon,  etc.), les institutions gouvernementales américaines (Pentagon, Agriculture, etc) et d’autres pays, l’ONU, etc. exploitent et tirent grand bénéfice du Web Sémantique.
La mission du Portail webAfriqa est d’être une plateforme de recherche, d’édition et de diffusion de l’Héritage Culturel de l’Afrique, en général, et de celui des Fulɓe, en particulier, en combinant les technologies du Web des Documents (Web of Documents) avec celles du Web des Données (Web of Data). Prise entre le marteau d’hégémonies extérieures rapaces et aliénatrices, d’une part, et l’enclume d’élites et de dirigeants nombrilistes et technologiquement somnambules, d’autre part, l’Afrique accuse des faiblesses systémiques aggravées par des obstacles structuraux. Ancrés dans l’histoire ancienne et récente, ainsi que dans le présent, ces barrages sont la cause et la conséquence du retard, technologique, économique, et dans une large mesure, culturel, du continent.
Et pourtant le Web Sémantique offre potentiellement une autre opportunité d’un saut en avant à l’Afrique. Mais, comme le dit le proverbe, il n’y a pas de roses sans épines. Le continent regorge de contenu et de données uniques, qui se prêtent aux technologies de recherche du Web Sémantique, certes. Mais la Révolution numérique a des exigences que l’Afrique ne satisfait pas. Les handicaps majeurs consistent en l’absence ou la faiblesse de l’infrastructure publique (énergie, eau, agriculture, élevage, pêche, forêts, finances, écoles, universités, hôpitaux, communications, transports, manufacture, etc.)
En définitive les questions restent posées de savoir comment et quand l’Afrique remplira-t-elle les conditions sine qua non qu’Internet et le Web Sémantique requièrent afin de pouvoir jouer leur important rôle d’éperon du développment.
A suivre.

Tierno S. Bah

Panama Papers and Open Source Software

According to reports, outdated and vulnerable versions of WordPress and Drupal — broadly used as Open Source Content Management Systems — are behind the Panama Papers Breach.
Tierno S. Bah
Sarah Gooding. WordPress Tavern
Sarah Gooding. WordPress Tavern

Authorities have not yet identified the hacker behind the Panama Papers breach, nor have they isolated the exact attack vector. It is clear that Mossack Fonseca, the Panamanian law firm that protected the assets of the rich and powerful by setting up shell companies, had employed a dangerously loose policy towards web security and communications.Drupal logo
wordpress-logoThe firm ran its unencrypted emails through an outdated (2009) version of Microsoft’s Outlook Web Access. Outdated open source software running the frontend of the firm’s websites is also now suspected to have provided a vector for the compromise.

In initial communications with German newspaper the Süddeutsche Zeitung (SZ), an anonymous source offered the data with a few conditions, saying that his/her life was in danger.

“How much data are we talking about?” the SZ asked.

“More than anything you have ever seen,” the source said.

The Panama Papers breach is the largest data leak in history by a wide margin, with 2.6 terabytes of data, 11.5 million documents, and more than 214,000 shell companies exposed.

Forbes has identified outdated WordPress and Drupal installations as security holes that may have led to the data leak.

Forbes discovered the firm ran a three-month-old version of WordPress for its main site, known to contain some vulnerabilities. But more worrisome was that, according to Internet records, its portal used by customers to access sensitive data was most likely run on a three-year-old version of Drupal, 7.23.

The current version of the Drupal 7.x branch is 7.43.
A release candidate (Drupal-1.0 RC1 ) of the 8.x branch is available for testing from Drupal.org, pending an April 20th  final release. — Tierno S. Bah

This information is partially inaccurate, however. While looking at the site today, I found that the firm’s WordPress-powered site is currently running on version 4.1 (released in December 2014), based on its version of autosave.js, which is identical to the autosave.js file shipped in 4.1. Since that time WordPress has had numerous critical security updates.

The main site is also loading a number of outdated scripts and plugins. Its active theme is a three-year-old version of Twenty Eleven (1.5), which oddly resides in a directory labeled for /twentyten/.

The Mossack Fonseca client portal changelog.txt file is public, showing that its Drupal installation hasn’t been updated for three years. Since the release of version 7.23, the software has received 25 security updates, which means that the version it is running includes highly critical known vulnerabilities that could have given the hacker access to the server. This includes a 2014 SQL injection vulnerability known in the Drupal community as “Drupalgeddon,” which affected every site running Drupal 7.31 or below.

Investigators have not confirmed if the open source software vulnerabilities were used to access the data, but it is certainly plausible given the severity of the vulnerabilities in both older versions of WordPress and Drupal.

“They seem to have been caught in a time warp,” Professor Alan Woodward, a computer security expert from Surrey University, told Wired UK. “If I were a client of theirs I’d be very concerned that they were communicating using such outdated technology.”

If these Open Source software vulnerabilities provided the access point for this massive leak, then this company’s global fiasco was entirely preventable. Although many people welcome the uncovering of corruption and dirty money transactions of famous people and world leaders, the reality is that these kinds of exploits can also be carried out on well-meaning organizations that exist to protect people’s health records, financial data, and other sensitive information.

This leak is not a blow to Open Source software’s credibility but rather underscores how low a priority some companies place on their tech departments and web security. With the rampant software vulnerabilities in this age, not updating software for years constitutes abject neglect of customers.

The bottom line is that software needs to be updated. This kind of routine maintenance is as foundational to a company’s business as brushing teeth or showering is for one’s health. Law firms and companies with such a lax approach to security are either ignorant or unwilling to spend the money to maintain technology that they don’t fully understand. The Panama Papers serve as a reminder that having a competent, skilled tech department is critical for any company that deals in sensitive information.

Sarah Gooding
WordPress Tavern

BlogGuinée 2015. Chiffres et commentaires

Courtoisie de WordPress.com et leur module d’extension (plugin) JetPack, voici les chiffres du trafic 2015 sur BlogGuinée et quelques commentaires :

Nombre de visitesNombre de visiteurs
55,49330,552
  • La moyenne de page visitée est de 1,82
  • Le nombre de pays ayant accédé BlogGuinée en 2015 : 165

Top Articles

TItreNombre de visites
Page d’accueil24.184
Guinée : la politique du “problème Peul”3.598
Angelina Jolie, Israel et la Palestine1.640
Jeunes et patriotes, rêves et carrières brisés968
Fulbe and Africa950
Guinea Mining. Exploiting a State624
Loffo Camara : victime-martyre de Sékou Touré481
Musique sacrée386
André Lewin : Qui a tué Cabral ?351
Alpha Condé. Mésalliances, vulgarité, absurdité305

Dix premiers pays d’origine des visites

 RangPaysNombre de visites
1erUnited States 17.421
2èmeFrance 10.975
3èmeGuinée 4.305
4èmeUnion Européenne 4.119
5èmeCanada 2.427
6èmeUnited Kingdom 1.417
7èmeSénégal 1.306
8èmeBelgique 1.146
9èmeAllemagne 1.046
10èmeNorvège 851

Sites référents

SiteNombre de visites
Moteurs de recherche20.940
Facebook.com4.346
Campboiro.org1.923
webAfriqa.net569
webGuinée.net*374
webPulaaku.net291
guineeactu.info284
Leydi.webguinee.net*264
webFuuta.net243
Guineepresse.info195

*On note que webGuinée.net apparaît deux fois, pour un total de 538 visites, conservant ainsi la même 4ème place.

Commentaires

  1. Le classement au premier rang de popularité de l’article Guinée : la politique du “problème Peul” n’est pas surprenant. Ce blog est est en fait précédé et complété par trois autres de mes écrits:
  2. Le succès du Angelina Jolie, Israel et la Palestine souligne la validité et la nécessité de la tolérance religieuse ; au plan universel et des trois croyances Abrahamiques : Judaisme, Christianisme et Islam. N’en déplaise aux extrémistes de tous bords.
  3. Venant en troisième position, Jeunes et patriotes, rêves et carrières brisés est un rappel douloureux de la destruction de la Guinée par la dictature de Sékou Touré, qui s’attaqua aux couches les plus porteuses du développement : intellectuels, businessmen, professions libérales, femmes, etc.
  4. Quatrième sur la liste, mon essai anthropologique Fulbe and Africa tente de dégager le rôle important — proto-historique, préhistorique, historique, économique, culturel, politique — de cette vaste communauté, qui vit dans trois des cinq régions que compte l’Afrique.
  5. Bouclant la liste des cinq premiers blogs 2015, le dossier “Exploiting a State on the Brink of Failure: The Case of Guinea” est extrait d’un rapport plus long préparé par J.R. Mailer, chercheur à l’Africa Center for Strategic Studies de la
    National Defense University, Washington, DC. J’informai le Centre de la republication de leur document sur BlogGuinée. En réponse, je reçus non seulement l’approbation positive de Joseph Siegel, Ph.D,  Directeur du Centre, mais aussi ses félicitations du fait que mon blog est lu par une audience de Guinéens, primordialement visée  par le rapport.

Bonne comparaison

Dernier point et non le moindre, les analystes de WordPress.com  suggèrent la comparaison suivante :

Si BlogGuinée était un groupe artistique, il faudrait une salle de spectacles de 2,700 places — par exemple le Sydney Opera House (Australie) — et 20 nuits de spectacles pour satisfaire les 55.493 visites du site en 2015.

Mes Meilleurs Voeux à Tous et à Toutes pour 2016.

Happy New Year 2016

Tierno S. Bah