importpandasaspdd={}start=Falsewithopen("Pfam-A.hmm.dat","r")aspf:fori,linenumerate(pf):l=l.strip()if"# STOCKHOLM 1.0"inlorl=="//":start=Trueelse:ifstart:pfID=l.split()[2]d[pfID]={}start=Falseelse:kk,v=l.split("")g,k=kk.split()d[pfID][k]=vdf=pd.DataFrame(d).Tdf.index.name="ID"df.reset_index().to_csv("Pfam-A.hmm.dat.csv",index=False,sep="\t")
Et c'est possible d'afficher l'ID du Pfam plutôt que le numéro ? Ou en tout cas, qu'au survol il y ait le numéro (ou l'ID si on garde le numéro) + la description ? Et tout doit être cherchable
En résumé, par ordre de priorité/certitude :
tous les champs du pfam sont cherchables
Dans le tooltip : Description + ID (short description)
replacer le numéro PF par l'ID --> en tout cas que ça puisse être changé selon l'usage.