J’ai testé pour vous….Talend Open Studio Data Integration v6.0.0

Talend a profité de l’été pour sortir une nouvelle version majeure des suites Open Studio (DI, ESB, MDM, DQ, BPM, BD) en juillet dernier, et il est temps de faire un point sur les principales  évolutions pour ce qui concerne la Data Integration. Petite précision : je ne m’attarderai pas sur la partie Business Modeler, car celle-ci n’a pas vraiment évolué en comparaison du Job Designer.

  1. Java

La version 6.0.0 supporte désormais Java 8 (tout en restant compatible avec Java 7).

Attention cependant, si vous disposez de plusieurs versions JDK sur votre poste, vous serez confronté à des erreurs au moment de l’exécution des jobs (par exemple : java.lang.UnsupportedOperationException: Cannot write indexes of this type due to unsupported collating sort order SortOrder[1036(0)] for text index ). Talend recommande d’installer un JDK complet (JDK+JRE) sur son poste plutôt qu’une JRE. Si le système ne parvient cependant pas à initialiser automatiquement le JDK, le message suivant s’affiche :

jdk

  1. Studio

L’interface du studio a elle aussi été entièrement revue :

studio_general

On peut déjà apercevoir un quadrillage sur le job designer. Les onglets ont légèrement évolué. Les icônes du Repository ont également été redessinés :

repository

Concernant le Business Modeler, pas de modification notable cependant.

Quant aux onglets de configuration :

  • On retrouve toujours les mêmes onglets, mais avec une icône légèrement modifiée pour chacun d’eux.
  • La grosse différence que j’ai pu identifier se trouve dans « Contextes » : des 3 sous onglets « Variables », « Valeurs en arbres » et « Valeurs en table », Seul le mode « Valeurs en table » a été conservé :

onglet_config

  1. Composants

3.1. Palette

Coté Palette et composants, quelques évolutions à noter.

D’abord la palette du Job Designer qui a été esthétiquement revue :

palette

On notera les 3 boutons du coin supérieur droit (assez appréciables) qui ont fait leur apparition :

palette_zoom

  • Les boutons (-) et (+) permettant de réduire et augmenter la palette
  • Le bouton en forme d’entonnoir permet d’accéder directement aux paramètres projet de configuration de la palette (panneau qui reste accessible par le menu Fichier > Editer les propriétés du projet > Designer > Paramètres de la palette) :

parametre_tos

Le mode Recherche a été amélioré également, puisque l’on peut désormais rechercher un composant par mot clé, sans connaître son nom.

Enfin, les composants les plus utilisés apparaissent désormais en tête de liste dans la palette (catégorie « Recently Used »).

3.2. Composants

Concernant les composants en eux-mêmes, ils ont apparemment tous été redessinés.

Quelques exemples :

composantspng

3.3. Connexions

Au sujet des connecteurs, toujours la possibilité de connecter via clic droit + glissé du composant « départ » vers le composant « arrivée », ou bien les menus contextuels « Row » (Ligne) et « Trigger » (Déclencheur). Une troisième méthode a fait son apparition : un petit hexagone blanc placé sur le côté droit du composant départ. On peut désormais faire un clic-gauche puis glisser la souris jusqu’au composant « arrivée » pour créer une connexion de type « Main ».

connexion

Seul problème : le symbole en question est tout le temps visible sur le Job Designer, aussi bien en arrivée qu’en départ des composants, ce qui surcharge un peu l’affichage du job. Par exemple :

connexion_bis

Heureusement, les développeurs ont tout prévu : on peut désactiver cette option dans les paramètres Talend : menu Fenêtre > Préférences > Talend > Apparence > Designer, décocher l’option « Use curved connection style for Job Design ». Cela a pour effet de n’avoir que des connexions en ligne droite (alors qu’elles sont courbes au premier lancement de l’application) et de supprimer le symbole de connexion des composants.

  1. Autres fonctionnalités

4.1. Mémoire

L’utilisateur à maintenant la possibilité de surveiller en temps réel la consommation de mémoire JVM et l’utilisation du processeur pendant l’exécution de son job :

memory_run

4.2. Bases de données

La version 9 de PostgreSQL est maintenant disponible sur cette dernière version de Talend. Cette dernière offre également la possibilité de récupérer des documents depuis le cloud GoogleDrive.

Cependant, les composants suivants sont désormais obsolètes du fait des limitations de Java8 : tAccessBulkExec, tAccessOutputBulkExec, tDBInput, tDBOutput et tDBSQLRow.

Pour les mêmes raisons, le pilote ODBC d’Access Connections n’est également plus supporté. Il convient d’utiliser le JDBC.

  1. En conclusion :

Talend répond avec cette nouvelle version aux principales demandes des utilisateurs. L’interface et le design des composants ont été revus, ce qui n’est pas totalement pour nous déplaire. Globalement, après des débuts chaotiques et une installation du JDK+JRE 8 en bonne et due forme, tout fonctionne assez bien. Petit point que l’on peut cependant peut-être reprocher, depuis plusieurs versions déjà, c’est la non-uniformisation de la langue dans tout le logiciel (certaines informations sont en anglais, d’autres en français).

Version 5.1 de la plateforme unifiée Talend

Talend a mis à jour en mai dernier toutes les applications Open Studio basées sur sa plateforme unifiée Open Source (studios, référentiel, outils de déploiement, d’exécution et de monitoring) :

– Talend Open Studio for Data Integration (intégration de données),
– Talend Open Studio for Data Quality (gestion de la qualité de données – ex Open Profiler),
– Talend Open Studio for MDM (Master Data Management – gestion des données de références),
– Talend Open Studio for ESB (Enterprise Service Bus – bus applicative d’entreprise),
– Talend Open Studio for Big Data (gestion des gros volumes).

Talend Open Studio

Pour rappel, avec la sortie de la version 5 de Talend en novembre 2011, l’éditeur en avait profité pour renommer l’ensemble de ses produits afin de faire plus clairement la distinction entre les versions gratuites et les versions commerciales, qui ,elles, sont payantes via une souscription annuelle.

Toutes ses éditions Opens source sont donc également disponibles en mode Enterprise avec une souscription qui offre des fonctionnalités complémentaires et un accès au support. L’édition Talend Enterprise BPM (Business Process Management – gestion des processus métiers), via le partenariat OEM avec Bonita Open Solution, est accessible uniquement en version Enterprise.

Les principales nouveautés de la version 5.1 (dont la dernière version disponible est la 5.1.1) pour la partie Data Intégration, sont les suivantes:

Amélioration du mapping XML via le support des multi-boucles dans le composant tXMLMap et support du XML au format document dans les composants SOAP, MOM, JMS et tFileOutputXML.

Nouveaux composants tSetKerberosConfiguration pour la gestion de la sécurité Kerberos et tExtractEBCDICFields qui permet de générer plusieurs colonnes à partir d’une seule colonne byte() en utilisant la taille de la colonne originalLength.

Talend Open Studio

Amélioration de la fonction Redefine (permet de conserver les bytes sur le disque dur en redéfinissant un groupe de bytes adjacents) afin de mieux prendre en charge le format EBCDIC.

Nouvelles versions supportées pour les connecteurs SalesForce.com version 24 (tSalesForceConnection), Microsoft Dynamics CRM 2012, Marketo version 1.7 (tMarketoInput, tMarketoListOperation et tMarketoOutput).

– Le type de données Dynamic peut maintenant être utilisé (sauf dans Open Studio) au sein des composants suivants : tUnite, tUniqRow, tRunJob, tReplicate, tAggregateSortedRow, tFilterColumns, tJoin, tSampleRow, tHashInput, tHashOutput, tFileInputPositional et tFileOutputPositional.

Nouvelle famille de composants pour le Big Data : tHiveConnection, tHiveRow et tHiveClose.

Talend Open Studio

– Le composant tWebService est désormais basé sur CXF 2.6.0 comme c’est le cas pour le composant tESBConsumer.

La nouvelle version 5.1.1 est disponible sur le site officiel de Talend, sur la page des téléchargements.

%d blogueurs aiment cette page :