A novel apparatus, system and method for sequence alignment of arbitrary string data, including nucleotide sequences, is provided. A root node is selected from a query sequence and located in the reference sequence. The root node is extended to encompass adjacent elements which are present in both the query and reference sequences, to form an extended root node match. The area to the left and/or right side of the extended root node match is then recursively searched using the same method to identify additional matches. When searching is complete, the joints between the identified nodes are classified according to their characteristics as, e.g., SNPs, deletions, substitutions, insertions, indels, and/or introns. The apparatus may be included in a DNA sequencing machine, or it may be a stand alone machine. Non-biological applications are also provided.Linvention concerne un appareil, un système et un procédé nouveaux dalignement de séquences de données de chaîne arbitraire, comprenant des séquences nucléotidiques. Un noeud racine est sélectionné à partir dune séquence dinterrogation et localisé dans la séquence de référence. Le noeud racine est étendu pour englober des éléments adjacents qui sont présents dans les séquences dinterrogation et de référence, pour former une correspondance de noeud racine étendu. La zone vers la gauche et/ou la droite de la correspondance de noeud racine étendu est ensuite recherchée récursivement à laide du même procédé pour identifier des correspondances supplémentaires. Lorsque la recherche est terminée, les articulations entre les noeuds identifiés sont classées en fonction de leurs caractéristiques comme, par ex., les SNP, les délétions, les substitutions, les insertions, les indels et/ou les introns. Lappareil peut être inclus dans une machine de séquençage dADN, ou il peut être une machine autonome. Linvention concerne également des applications non biologiques.