Rename genomeAPCAT package to PanACoTA

d0fc0ff5 · Amandine PERRIN · 986cf683 · d0fc0ff5 · d0fc0ff5 · d0fc0ff5
Commit d0fc0ff5 authored Apr 25, 2019 by Amandine PERRIN
--- a/MANIFEST.in
+++ b/MANIFEST.in
-include genomeAPCAT/align_module/prt2codon.awk
+include PanACoTA/align_module/prt2codon.awk
\ No newline at end of file
--- a/genomeAPCAT/__init__.py
+++ b/genomeAPCAT/__init__.py
--- a/genomeAPCAT/align_module/__init__.py
+++ b/genomeAPCAT/align_module/__init__.py
--- a/genomeAPCAT/align_module/alignment.py
+++ b/genomeAPCAT/align_module/alignment.py
--- a/genomeAPCAT/align_module/get_seqs.py
+++ b/genomeAPCAT/align_module/get_seqs.py
--- a/genomeAPCAT/align_module/pan_to_pergenome.py
+++ b/genomeAPCAT/align_module/pan_to_pergenome.py
--- a/genomeAPCAT/align_module/post_align.py
+++ b/genomeAPCAT/align_module/post_align.py
--- a/genomeAPCAT/align_module/prt2codon.awk
+++ b/genomeAPCAT/align_module/prt2codon.awk
--- a/genomeAPCAT/annote_module/__init__.py
+++ b/genomeAPCAT/annote_module/__init__.py
--- a/genomeAPCAT/annote_module/format_functions.py
+++ b/genomeAPCAT/annote_module/format_functions.py
--- a/genomeAPCAT/annote_module/genome_seq_functions.py
+++ b/genomeAPCAT/annote_module/genome_seq_functions.py
--- a/genomeAPCAT/annote_module/prokka_functions.py
+++ b/genomeAPCAT/annote_module/prokka_functions.py
--- a/genomeAPCAT/corepers_module/__init__.py
+++ b/genomeAPCAT/corepers_module/__init__.py
--- a/genomeAPCAT/corepers_module/persistent_functions.py
+++ b/genomeAPCAT/corepers_module/persistent_functions.py
--- a/genomeAPCAT/pangenome_module/__init__.py
+++ b/genomeAPCAT/pangenome_module/__init__.py
--- a/genomeAPCAT/pangenome_module/mmseqs_functions.py
+++ b/genomeAPCAT/pangenome_module/mmseqs_functions.py
@@ -162,6 +162,7 @@ def do_pangenome(outdir, prt_bank, mmseqdb, min_id, clust_mode, threads, start,
    tmpdir = os.path.join(outdir, "tmp_" + prt_bank + "_" + infoname)
    os.makedirs(tmpdir, exist_ok=True)
    bar = None
+    logger.debug(mmseqclust)
    if os.path.isfile(mmseqclust):
        logger.warning(("mmseqs clustering {} already exists. The program will now convert "
                        "it to a pangenome file.").format(mmseqclust))
@@ -183,8 +184,9 @@ def do_pangenome(outdir, prt_bank, mmseqdb, min_id, clust_mode, threads, start,
            bar.finish()
        pool.join()
    # Convert output to tsv file (one line per comparison done)
-    families, outfile = mmseqs_to_pangenome(mmseqdb, mmseqclust, logmmseq, start, panfile)
+    #  # Convert output to tsv file (one line per comparison done)
-    return families, outfile
+    # -> returns (families, outfile)
+    return mmseqs_to_pangenome(mmseqdb, mmseqclust, logmmseq, start, panfile)
 def run_mmseqs_clust(args):
@@ -200,15 +202,15 @@ def run_mmseqs_clust(args):
            * mmseqclust: path to base filename for output of mmseq clustering
            * tmpdir : path to folder which will contain mmseq temporary files
            * logmmseq : path to file where logs must be written
-            * min_id : min percentage of identity to be considered in the same family\
+            * min_id : min percentage of identity to be considered in the same family
-             (between 0 and 1)
+            *         (between 0 and 1)
            * threads : max number of threads to use
            * clust_mode : [0, 1, 2], 0 for 'set cover', 1 for 'single-linkage', 2 for 'CD-Hit'
    """
    mmseqdb, mmseqclust, tmpdir, logmmseq, min_id, threads, clust_mode = args
    cmd = ("mmseqs cluster {} {} {} --min-seq-id {} --threads {} --cluster-mode "
-           "{} --kmer-per-seq 80 --max-seqs 300").format(mmseqdb, mmseqclust, tmpdir, min_id, threads, clust_mode)
+           "{}").format(mmseqdb, mmseqclust, tmpdir, min_id, threads, clust_mode)
    msg = "Problem while clustering proteins with mmseqs. See log in {}".format(logmmseq)
    with open(logmmseq, "a") as logm:
        utils.run_cmd(cmd, msg, eof=False, stdout=logm, stderr=logm)

--- a/genomeAPCAT/pangenome_module/post_treatment.py
+++ b/genomeAPCAT/pangenome_module/post_treatment.py
--- a/genomeAPCAT/pangenome_module/protein_seq_functions.py
+++ b/genomeAPCAT/pangenome_module/protein_seq_functions.py
--- a/genomeAPCAT/subcommands/__init__.py
+++ b/genomeAPCAT/subcommands/__init__.py
--- a/genomeAPCAT/subcommands/align.py
+++ b/genomeAPCAT/subcommands/align.py