diff --git a/non-regression-tests/check_HK97_class.py b/non-regression-tests/check_HK97_n8_class.py similarity index 100% rename from non-regression-tests/check_HK97_class.py rename to non-regression-tests/check_HK97_n8_class.py diff --git a/non-regression-tests/check_n8_res.py b/non-regression-tests/check_n8_res.py new file mode 100644 index 0000000000000000000000000000000000000000..7fa6c78298be260567480090b8f2375f224fed17 --- /dev/null +++ b/non-regression-tests/check_n8_res.py @@ -0,0 +1,45 @@ +import os + +from common import check_files, remove_files, K_OK,K_WRONG_SEQ,K_WRONG_COH + +DATA_PATH="./data/" +REF_RES_PATH="./reference_results/res_n8/" +ref_filename=REF_RES_PATH+"n8_sequence.fasta" +ref_cohesive=REF_RES_PATH+"n8_cohesive-sequence.fasta" +new_filename="n8_sequence.fasta" +stats_filename="n8_statistics.csv" +report_filename="n8_PhageTerm_report.pdf" +new_cohesive="n8_cohesive-sequence.fasta" + + +ret=check_files(new_filename,stats_filename,report_filename,ref_filename) +if ret !=K_OK: + exit(ret) + +f_ref=open(ref_filename,"r") +ref_s=f_ref.read() +f_ref.close() + +f_new=open(new_filename,"r") +new_s=f_new.read() +f_new.close() + +if (new_s!=ref_s): + print("rearranged sequence does not match what is expected") + exit(K_WRONG_SEQ) + +f_ref=open(ref_cohesive,"r") +ref_cs=f_ref.read() +f_ref.close() + +f_new=open(new_cohesive,"r") +new_cs=f_new.read() +f_new.close() + +if (new_cs!=ref_cs): + print("cohesive sequence does not match what is expected") + exit(K_WRONG_COH) + +# clean files +remove_files(new_filename,stats_filename,report_filename) +os.remove(new_cohesive) \ No newline at end of file diff --git a/non-regression-tests/common.py b/non-regression-tests/common.py index 5a155b83fddd2eabcd781250309da663a6d66ea7..cb384056127d59245c5b90db6fbe9afaab8cac3c 100644 --- a/non-regression-tests/common.py +++ b/non-regression-tests/common.py @@ -15,6 +15,9 @@ K_REPEATS_DOESNT_EXIST=12 K_CLASSFIC_DOESNT_EXIST=20 K_WRONG_CLASS=21 +K_WRONG_SEQ=30 +K_WRONG_COH=31 + K_OK=0 diff --git a/non-regression-tests/data/n8.fasta b/non-regression-tests/data/n8.fasta new file mode 100644 index 0000000000000000000000000000000000000000..5fef9fbfda59ae7d32c54b1f2e6d2d2563d82d9c --- /dev/null +++ b/non-regression-tests/data/n8.fasta @@ -0,0 +1,622 @@ +>n8 +CGGCCGTTCACAGTACACTCACTTAGCATACGCTGATACTATTTCAGGAAGCGGTTTTAGTCAGACTGAC +CAAAATAAGGCCTTTATTGGGATGTATCAAGACTTTACGGTTACAGACTCAAAGAATCCAGCTGACTATC +GCTGGAGCAAGTGGAAAGGATCGGATGGTGCAAACGGTATACCAGGTAAGCCTGGAGCTGATGGAAGGAC +GCCTTATATTCATTTTGCTTACTCTGACAATGCAGACGGTACAGGCCTGACAGTAACTGATAATGGTCAA +CGCTACCAAGGTTATTATTCGGACTATACGCAAGCTGATAGCACAGATAAGGCCAATTATAAATGGATTG +ACCGCTGGGCTAAAATTGAGGTTGGGGGTAGAAACTTAGCTCAAAAAACTAGCAAAGAATGGTCACTCCC +TTATACAGATTTTAAAGGCATAGCAAATACTTGTCCTGATTTGTACAAGATACTAATTGATGGTTTAGCG +GTTGGTGATACGCTTAAATCACGCATTGTACTCAAATACACTGACGTTGTCCCTGCTAGTGGGCAAACAG +CTTCTGTATGGTTACAAGGGAGTGGTGATGTTACCGTTTGGAATGCTGGACGGTATAACGATAGTTCGCG +AAAAATAATTAGTGGAAGTGGCGAAGTTGTTTTTGAACATGAATTTAAGATTACTGCTGATCATTTGAAA +AATAAGTGCTGGTACTGGCAATTCAGAACGGATTATATTGCTAGTGGTTTGTTGCAATGGAAACTTGCTA +AAGTTGAGTCTGGAACTGTTTTTACAAATTGGTCACCGGCTCTCGAAGACGTTCGGGCTGATATTGATTC +CAAAGCTGACCAAGTTCTAACTCAAGAGCAACTCAACGCTCTCAATGAGAAAGCTGGGGTTATCCAAGCC +GAGTTAGAGGCAAAAGCTAGTATGGACACGGTTTCTAAGTGGTTTGTTGATTTTCAAAAGTTCGTCAAAG +AAGACGCCGCAGGAAAATCACAGTCAGAAAAAGATCTACTAACCCTTACCCAAAGAATAGAAGTAATGAA +TTCGGAATTTGGCGACAAGGTTGCACAGTGGTCCTTTTTGGATGACTATATGCGCGCAGGCAACAAGGGT +CTGGTAATTGGCAAAAAGGATGGTTCGTCATCTGTCCGTGTGTCAGACAATCGGATTTCGTTTTACTCTG +CTGGGAAGGAAGTTGCTTACATTTCTGGTGGTGTTTTACGAATTGACAACGGGGTATTTACCAAAACGTT +GCAAATTGGACGTTTTAGGGAAGAACAGTACCACATTAATCCAGATATGAATGTAATCAGATATGTAGGA +GGCAACTAATGGCTGAATTTTGGTCAAATAATGATAGAGGATACCGCATCCGTTTATGGGTTGACCAAGT +ATCTCAAAATACACAGGACAACAGCAGTCAAGTAAGGGTACGGCTGGCATTGCTTAATACTACGACAACT +TTTGCGCAGTATAGCTGTAGTGCTTATGTTGACCTTAACGGTCAACGTTTAAATTGGTCTGGTAGCCCTT +CGATGTTGGGGTACAATCATACTATCATGCTCATTGACCAAACTATTACAGTTGGTCATAATGCAGACGG +AACTAAGACCTTTGGCTTGATGGCTAGCTTTAGTGGTGGCGGTGGATGGTCACCCGGCAATCTAACCATT +GGTGGCAACTCATTCACGCTTACCACTATTCCGCGCTCCAGCTCTGCTAGTGTAGTTGCTGGCGTTATCG +GTAGCGCAGTTACTATCAACATCAACCGTCAAAGCTTCAGCTTTAAGCATACGGTCCGTTATGCTTGGGG +CAATAAATCTGGAACTATCGCTAGTAATGTAGATACAAGCGTTACATGGACGATCCCTCTTGATTTTGCT +AACGACATTCCCAACTCATCAACGGGTACAGGCACTATTTATGTTGATACTTACTCAGGAAGTACACTGA +CAGGGACGCAGTCTGTTACATTTACTGCAACAGTCCCGGACACAATGAGGCCTACATTGTCCAGCGTCAC +GTTGTCAGATGCTAACACGATTGCTCAAAATTTAATCCCTAACTCTGACACGTTCATCCAAGTCTTATCA +AATATTAAGGTGGCATTCGATGGGGCAAGTGGATCGTACGGATCAACCATCACTGGGTACCGTGCTGAAA +TCGTTGGTAAAAACCAAGCTACAAATATCAACGGTGGGACTCTAGGTATCATGAATTACAGTGGGGATGT +CACTGTCAGAGCTAGCGTAGTTGATAGCCGTGGCCGTTGGTCGGAAGCGAAAAATATCCAGGTAAAGGTG +CTTGAATACTTCGCCCCCGCTTTAAGTTTTAGCATCGCACGAACAGGTTCAACGTCTAGTACGTTAACTG +TGACTAGAAATGCCAAGATAGCACCTCTGCCAGTCAATGGGACCCAAAAAAACACCATGACCCTCACATT +CAAGGTTGCTAGACTCGGCACAGAGTCATACAGTCCAGACAATGGGTCAGCAAGTGGAACATGGTCAAGT +ATAAGCACACTAATCAACTCTCAAGCTAACCTTGCAGGCAATTATCTAGCTAATCAGTCGTGGGTTGTCA +TTGGGACGCTTGCTGATAAATTTACTCAGACAGAGTTTGCTGTCAATGTAGCCACGGAAAGCGTGGTCTT +CTCTTATGACCGTTCTGGTGTTGGAGTTAACAAAATCCGTGAGCGTGGAGCACTTGATGTAAAAGGTGAT +ATTTATGCTGATGATAAACCTATACAACAGTACCAACTTACTAATAATAGTGGTGGCTTGAATAATGGTG +GATGGAATCAACCATGGAACATTCAAAAGACTTCGTTCGATTGGCGAAATGGCAACTTTGCCGACCACCC +TCTAGGCAAAAATGGCCCGTGGGGGCTATTTCAAAATTACTGGCTTGATACTTGGAAGGGTGCTCAATTC +TTCACAGAGTTCGGCAATGGTCGTCATTTCATGAGGTATTATAATAATGCTCGAGAATGGAAACCTTCGC +CATGGAAGGAATTTGCTTTTACTGATCATCAAAACCTCATCAATACAGGATGGGAACCTGCTGGCTTTGA +GGGGACATACTATAAGCGCGTGGGGGATGTGTTAACTATCAAATATGACTTCGTTGGGAACGGCTCAGAT +ATGAATATAGGTACTATTCCTAGCGAAATTTGGGTAGCACCCCAATCTTACATGTTACTCATAGCAAAGT +GGTCTATTGGTGGCTCCGACAATAGTCATGTTCAAATAAATAAAGGCACAAGCGCCTTGAATGTACTATC +AACAGGTAAGGGAACAATCTACCAAGGTCAACTAACCATCATGATTTAGAAAGGAAATACCATGAAATTT +GAATACGGCTCAAAATCACAAGAATATGACACAAGTGGTTCAGCGAGCACTACCAAAGTCACCCTAGTAA +ATGCTGAGGGAGCTACTATCCCTGTGCATCTTCCAGCTGATAAGATCGATTTAAATAATACAGAACTACT +TGAGTTAGCCTTAGAAGTCATCTATCAAGAAAACTTTCCAAACCGAGCAGAAAATGAGAAATTTGACAAG +GTGGATGAGCAACTACAAAAAAACAAAGAGCTTGCAGGCAAAGCTGAGCAGGTTGCGACTGAGAATAAGG +AATATCTTGATACTGTTTCAGCGATAACTGAAGTATTGATTGCTCTTGCTATCTCGCAAAATGGGGGCAT +GCCAACTCCAACCTACAACAAGGTGGCTCAGTTTATCAAACCTTTAACCAAGAGCGCACGATATGTCAAC +GGCGACATCGTATCTATGCCTTATCCGTTTGATACCAACAGTAAGTGGCCAAGAGGGACAGCAACCATCT +TCAAATTCCAGATGCAACAATCAGAGGGCTATACCTATAAGGAGCAAGCGTTGTCTGACATATTACAACA +AGGCGTACTCACTGTAGTTATGCCACGGATCGACTAAAAGGAGGGACTATGACATGGCTTGATGTATTTG +AGAGAATAATACACGGAACATCTCAACTAGGACCTACAATCGGGCTCATCGTATCTAGCTGGTTTGGATT +GCTTGCTGGCAGGTCTGGCAATCTCAATAAACAACAGTTTAAGGAGTTAAAGGACGAACTTGGAACAATC +CAGCTCTCTGTGGATGATGTACGAGAGGTCGGAGAAGATAATAACAAGAAGATAATTGAAGTTAACGAAA +AGTTAATTGTACACGATGAGGCTCATATAGTGACAATGTATCTACGTTTAGAGCGTGATATGACTGCGGC +AATCAATCGAGGGTACACTACTGTGCATGAGTCCGACATCGTGTATAGAATGCATGATAACTACAAAAAA +CTTGGAGGTAATGGGCGTATAGATAGCCTATTTGCCAAGTACAACCACTTAGAAGTGAGGAATTAAATTA +TGAAAATCAACTGGAAACTACGTTTTAAGAACAAAGCAACTCTATCAGCTATTGTAGCTACTATCATCTT +GCTCGCCCAACAACTGGGCTTAAAATTACCTGACAATATTTCTGAGGTTGTCAATACAGCTCTAACCTTG +CTTGTTTTGCTTGGGGTTGTGTCTGATCCAACAACTCAAGGATTGTCTGATAGTGATAATGCTTTGAATT +ACCACCAACCTCGTGAGGACTAGCATAAAAGCCATACAATTATTGACAAAAACAGCATTTTGTCAATAAA +ACAAGAAGAAAGGAGAATCATGACAACTAAAGCACAATTATTAAGCACCCTTGATAGCTTAGTTAATCAG +CGTGTGACAGTGCCAACCAACCCATACGGTGGACAATGTGTAGCCTTGATTGATAATGTTTTGCAATATC +AAGGACTGTTTAGCCTTGATTTTAGCTATTTGAATGCTATTGACGGGCTAGAACGTGCTGCAAGTCTAGG +ATTGAAAGTAACACCATTTAACGGTTCTAACAATCCGCCAGTGGGTTCTGTCTGTGTAACTAACTGCTTG +CCATATCATCAGTTTGGTCATATCTTGTTTGTAGTGTCGGAAAACCCAGACGGTACCGTTACCACAATCG +AACAGAATATCGATGGTAATGCCGATGCTTTATACAATGGCGGTTGGACTCGCAAAGTCACTAGAAACCT +TGACAGCGCAGGGAATTTCAGTTATATCGATTGGAATGCGCCAACACAGCAAATGGTCGGATGGTTTGAA +TTGCCATTCGATAATTCTGAAATCGAACAGGGTGGCCTTGGTAAAGGTGATTACTTCATCGATGTATCAG +CATATCAAGCAGGAGATTTGACTGGAATCTGTCAGGCATCAGGCACTAATAACACTATCATCAAGGCTAC +TGAGGGCATCGGCTGGATTAGTCCAGTAGCTACTCAACAAACTAACACAAGTAACTGCATCGGTTATTAC +CACTTCGCCCGTTTCGGTGGAGATGTGGCAACAGCACAAGCTGAAGCCAACCATTTCATCAGTAATCTGC +CATCACGCCCTCGTTATTTGGTATGCGACTATGAGGATGGCGCTAGTGGCGATAAACAAGCGAATACTAA +TGCAGTGTTAGCGTTCATGGATGTTTGTAAGGTAAACGGGTTCGAGCCAATATACTACAGCTACAAGCCT +TATACGTTAGCAAATGTATACGTTGAGCAAATCACCGCTAGATACCCTAACAGCCTATGGATAGCAGCAT +ACCCAGATTACGAGGTACGCCCTGAACCATACTGGGGTGTATATCCAAACATGGAGCATACTTGTTGGTG +GCAATTCACTAGCACGGGCTTATCTGGTGGGTTGGATAAAAACGTTGTAATTATTGGAAGTGAAACGAAG +AAAAAAGAAGAAGAGGAAGAAGATATGAATTTTGTAGTACGTAGCACATCTGGAAACCAAGGATACGTTG +GAATTGTTAACGGCCGTGTGTTTGGAATTGGCGACATGGGAACAGTCGATGAATTGCGTTCAAACGGTGC +TAAACACTTAACACTCAATGATGATGATTTCACACGTTTCCTTGATAGCCAGTCACGAGATTCTGCCGAA +GTGTCAAAAGCTATCGGAGAAGCTAGTGCATCAGTCGTTAAGGCTATTGAAGAACGTGGGAACGCTACGC +AAGGACAAACTGGGAAATAAAAAACATAGACCACGAAGAAAAAATTAAATAGAAAGAAGGCAAATCACCT +CCCCTCAGACTGCAACAGGGATATCATGGCAGTGGTGGTCGAGCCTCAGCATTGCGCTGGGGCTTTTTTT +ATTTTGCAAAAAAACCACTCTAGGAAACTAGGGCGGTTTTTGATATTTTAGAAATCTTTTGTGAATAGGT +GGTCATCACCCGTCAAACACCCGTTTTTTGAAAATTTTCTGTCTGTCTTTATCTTATTCTAAAAAACAAA +TTCCCTATAAAATAAGGTTTTTATAGGGATAAAACAAGAATAAAAACGCCCTGAAATCCCCTCCTCTCCT +TTTATCCCATTGATATATCAAGGGTTTTGGGCACTTCCCCCGTTTTTCACCCGTCAAATTTCAAGGTTTT +GAAAAATCTCTTTGACTTTGTGGTCGTTTTTTTCTTTTAAGCTTTCAATTTGGTGGGCATAAGTTTTGAG +TGTAATGTTTAAATTTTCGTGTCCCAAAAGTTTTGATACGGATATTAAATCCACCCCTTTATAAATCAAA +TAAGAGGCGTACGTGTGCCTTAAGGAGTGATTGGTGTAGCTTTTACCAGTCACTCTTTTTATAACTTTAT +TAGTGGCGTTATTAGATGCTCCATAGCATATACGCCCTAAGTCGTTATCTCGGTAATGATTGTCCCGATA +AAGTTTTAAAACCTCAAGGCTGTTTTGGTCAATAGGCACTACTCTGATTGATTGTTCATTCTTTGTAGCT +CCAAAATCTTGCGATATGGAATAGTCAAAAGATTTATTGACATCTATGTAGCCATTTTTGAAATCGACAT +CATTCCATGTCAACCCTTGCGCTTCGGCAAAACGTAAACCAGTTACGCCAATCAGAAACGTGGTGAAATA +AGATGGATGCTTAATCTTTTGCTTGGCTATTTGCAGATAGTGCAAGTATTCATCCTCTTCCATGAACTTT +TCAGATTCTTGCTTGCCAGACTTTTGCGCCTTGACGATAGCACCCTCAGCAAAATTGTCACGAATGATCC +CGTCACGAATAGCCATTTTGCAAGCGCCTTTGATTTGATAATGGAATTTTTCGAGAGTTGATTGCGCAAC +GTTTTCGGCAAATTCGTTTAATATTTGTTGATAGAACGTGTGCGTGATACTTTTAAGTTTACGCTCACCA +AAAAGTCGTTCAATGTGTCTGAAATTCTTCTCGTAAGTTTTCCAAGTTTTAGGGGTAACATGCGGTCTCT +TGTATATATCTGCCCAGCGTTTGTTGTAATCGAGTACTGTGATGTCTAGCAATGCGTCTGAGACAGTGCT +GAGCTCTAATTCAACTTGTTGCGCTGCCACTTTGGCTAGTGTCTTGGTCTTGAAACCACGTTTTGACTTT +TCACGTTTCTTGCCATGACTGTCTCTATATGTGATACGATATTCCCAGCCTGAATCCAATTTTCTAAAAA +ATGCCATTGTCAAAAACCTCATTTCTTGATAAAATGAGTACAGTAAAAAGGGCTTTTTAATGCCGTTTAC +TATACATGGTTGCCTCACGCTCAGACTCGCCAAAGTTTGAGAGCGTGGGGATTTTTGTTGACTATAATAA +GGAAATGGTATAGAATAGAGAGTGAAGAAAGTGTCTTTTTCTAAAATTAGTTTAGAACCTGCCCTTCTCC +TAGCAAATCCCCGCTAGTCCCGACGATAGTTTTCTGCATCTCGAGCAGTCCTCTATCGTTTTTTTGTTAT +ATTAAATTTCCATTGCTAATTAAATCATAAGCCAATAATAATCGTCTCTGAGCTGATAATTCTGAAGCGT +TGTCGTTATAATTATCTTGCAGGACAGGAATAACTTTGGTATTGATATAATCTAGTACAGTATCTTGTGG +AATACTCTCTATGTTAAAAGCTATTAATTCTAATTCTCTTGTTTTAGGTGCGTTGAGCTCTAGAATGGTT +TGCAAATCGCTGTATGCCTTTTTGTTGTGTTTGGGTACCGTATCAATGATGTTTTGCAGAGTTCCCATCT +TATTGATTCTGTTGGAGATTTTTTCTTTTTGTTTTTTAGATAGGAAATCAAACTTATCATAATCTACATC +TTTTAGATATTTTACAAAAGGGATTCTAGCTTGTGTATTTTCGTTAGCTATAAATCGTAAGGCGACTTCT +GGTAAGAATGTGGCTCCATCGTTGAAATAATCTTCTACATAATCGATGTAGCTAGGATTTACAAACATAT +TCTTTTTATCACCTAAAGCGACGACTATCCGTCGTTTTTTTATATCTTCAGGAAGAGTGTCAAGATTTTG +TGGACTAACAATGTAACTATCAAGTTTACCTATTTTACCTGCAGTAACAATTATAGTTTTTATTGATTCT +TGAAAACGATTGACTTCATAAGGAGTCAATCCTTGGTTTATTTTTCCTATATCTGAAAAAATTTGTTTAT +AGTTATCCGTTCTTAGAATCGAATGTGAGATGTTTAAAGAAGGATTATTTACAATTTGTTCTGTAAAACT +TTGATTATCCTTTTCGTATTCTACAACTGTGATTCGATTAAGATTTTTCCTCATGTCATCATTTGGAAGC +TGTGAAGCAAAATCTGTCAATAATTTTTGAACATTTCTATCAGTAAGAGAATATCCTAAAAAAATAATTG +GTGATTGAATTAAATTAGAGAGTATTTTTGCACTGATTAAAATGGAATTTTGATCATAAGCTTCATAATC +ATTTTCTGTGATAATAATACTGCTAGGGTCGTTTACATCTCCATGAATTTTGAACAATTCTGACCAGTTA +TAGGTTTCGTCAAAAAAACCTTTTTGACCAATATAAACAGTTGGCTTTTTATCTAATTCTTCAAGTAAAT +CTTCTGTTAAAGTGTCATAATTCGTAGTCACAATAACTTTAGCTTTCGATAGAAAGTTCTTATATTCTTC +TATCTCGTCACGCATCTCATTTTTAATTTCATATTTTGAAAAACGCTGTGCAACAGAGTATTTAAAAGGT +GAAATGTTATTTGAATAAGCTTCTTCATCGGTAAGACCCTCTACAGAAATGGTTCCATCATAAAAGAGGT +CGTCGAATCTTTGCTGGATGTAAGCCGCAGTCTTTACGTTAACTAAAAAATCTTTTTCTAAATCTGTAGT +AGTTTCTGGAATTTCCGATCTTTTTAGTGAGCGTTTGAATTGAAAAATACTGGTTGGTTCTTTTATTTGC +TCCCAATATTCTTTGAGGAGAGCATCCCAGGTAGGAAAATTTTCCAAATAACGTTTTGACATTCCAGAGC +CAATAAATACAATTGGATAGCTATTGTTTTCGATAATATCTTTGATCATATTTACCCTCTTTCATTCCCC +CTCCTAATCTTATCCCCTATACAAATCTACAACTTTACCGATAATCCTAAAGTCGCTATCGGCATCTACT +GGTATATCGTCATAGTCAGAGTTTAGACTATGTAGAAATGCGCCTGCGTCTCCTAGCAGTAGTTGCTTGA +TATAAGCGTCACCGTAGTACTCAAAAACGCCTATATCGCCGTCTGACAGTTCTACGGTGAGCTTGACAAA +GACATAGTCGCCAGAGTGGTATTCTGGCTCCATGGAGTCGCCATAGACTGGAATAACAAAGTCTGCATCA +ACATCCACTGGCAACTCAATCTGTTCCACTTGTACATCGTTCAGATATTGACCTGTACCTGCCGAAGCAG +GCTGGTCGTAGTAGTTGTAGGAGTAGAGGGCGCGTGGCTCTTCTACTGTATTGTTACTGTCTTCTGCTGT +ACTTTGTTTATCTAGGAGGCCATTTCCGTAGCGTACCCAGCGTTTATGATTATTCGGGTGTAATTCCTTG +TCCAAGTGCAAAACGTCTGCCGAGGGGCTGTCTGGGGCTTTCTGTGAAATTGCTGGAGATGGTTTTGAAC +TATTAAATAGGGCTTGCGGTGTAACATTTAGAGCTTTAGCGTATGTTCTTATATCCAATTCATCTAACTG +TCTCTTCCCGTTTTCGTGATTTGAGATTGTATTTTGTTTAAAACCTGTTAATTTTGCTAAATCCTTTTGA +GTTAGCTTTTTTGACTTTCTTATTGATTTAATAGCATTTCCAAGGATGTTCATAAGCTTCGCATTCCTTT +CTACATATAATATAACATAATGAGATAAAAAAATAAACAAAAAAATCTCAAAAAGAGATAAAAAACAGTT +GACAAAATATCTCAAAATGAGATATAATATAATCAAGGTCAAGGAAGTGACCTGAAAATAACAAAAGGAG +GTACAGCTAATGGCTAAACATGAAAAAGAGCCTAAACACAAGGAACTAGAGTTCGAAGTCAGTTTCCTTA +CGTTTAAGCTCAGATTCAAATTCATAATCAAGTGGTAGCTTGATTAGTGAGGGGCGTAAGCCTCTCGCCC +CGTTACGGGGTGTGGTTATAGTTTAACATATTTAGTTGTACCTTCGCAAGAAAGGAAGTAGAAACATGAA +ATGGAAGAAGTTTCTTTTTGGTGACATTCATTATAAAAATGAATTAGCAGATGGAAATCAAGAAGTAGAA +TTCAAACTAAAAGGTGGATTAATCCCTAATTTGGTCTTATTGATTGGTGTTATTTGGCTTGTTTGGCTAT +TATTTAGATAGGAGGGCGAATGAATATTATTATTGTTATTCTTATTTCTTTTATGGTGTCGGTTCTGTCT +TCGTTGATAACCATAAAATATGTTACTGAAACATTGGCAGCTTCTTGGTTACATATTTCAATTGATAGTT +ATCGAAAAGCTCAGGAAAAATACGAAAATTTAGTATAAAGAAAGGATAGAGGGATGAACGAAGAAGACTT +GAAAGAATTATTGGAATTCGTAGCGACAGATTATGGACGAGGGTATCTAGATGGAGTAGTTGGGGGAGTT +TCAGCACTTTTGAAAACTTCAAAAGAAGCAGAGTGAGTTCTCCGCTTTCATCAAAATTATTTTGATAGCT +TATCTACAGCTTAAGGAGAGTAGGGGGAACATTGTGAACGAACTTAAAATCCGTGATGACAAAGTATCTT +TGAATGGCGAAGAGTTAAAAACTTTGACTAAATTTGAAATAAAAAGCACAAGAAGCGCTAGGAAGGAGTA +GAATATGGCTAAATCAGTAAAACCAGTTTTGTTAATAGAAGTTACTGAAAAACGTGGCACAGGTAATGAG +GGTGACCCGGCAAGAGTTGTAGTTCAATATTGGGATTACAACAATAACTTAATTTTTGAATCAGACCCAA +CTAAGAGGGATTAGTTATCTCTATTTTCAATAGCTTTTCTATATGACTCTGGTAGAGAATTGTACACCTC +AGATATTTTTTTAGGTTGAGTAATTCGATTATCTATAATCAGGTTGATAAAATGAAGTAATGAGAGCGCT +AGTTCTTTGTTATCTTTGATATTAATTTGTCCGGGATGAACAGCGTTATTCCCGATAACTCTAACACTAT +CAAGCATTTGCTGAATTTCGACAGGCATCCCTTTAGAAACTAACTTTCCGATTTTTGAATTTAGATCTTT +ACCCTCGGCTTCAAGTCCGTCTACTAACTTTTCAATAGCCAATCTTGATAGTGCAGCTGAGGCTCTTGGA +GATTTTTCAAGGATTTGACCGGCTTCGATAAAGATTTCTTTGACATCGGACGGCATGTTAACGTTAGGTT +TAGGGACTTCATTGGATACACTAGGAAATAATAATTTAACATTCACATGACTCTTGTCTAATTCAGCATA +TGAACCCTCTTTTATTAAAGGGAGTTCATTTGTTAACCAAATAGAGAAGTGTTCACAAGCTTGACATTGG +GCGATGATGGTAAACCTTAATGTTTCGGAGTATCTTTGGTGGATCACAACAGGTTCATACATCCATAGAT +GAGAAGCGAAACCAGAACAATTTGGGCATTGAAAAGCTTTTGAGTTACCTCCAAACCCACCACCTAAAGA +TAACTGTGAAAAATCAAATTCCATAACATTCTCCAATCATTTTATTTCCATTATACCATTTTAGAAAGGG +GGTGAGAGGATGACGAAGAAACAGCGTTTAAAACAACAGCATCTTAAACCTAAAAAACGACTAAGAGAAG +AGCGTCTTAAACGTGAATACACAGAAATGTACATGGCTGATTTAATTGGTTTGAAAAATCGCAAAGGTTA +TTCTGAAAAAGAAGATGGATTGCAAGCATTCAAAGATTACGAAATGGCTATTATTTCTGAAAAATTTGGC +ATTTCAGAAGCTGAATTATTTTTTTAAAACAAAATATCTCAATATGAGATAAAATTATTAAGAATTAATA +GATAAAAACAGAACTTCAATAAACACTTGCCAGCTATTTAGAAAGGAGCTATATGAACAATTTAATCAAC +GTAACTTTAAACGAAAACCAAGAGCCAGTAGTTAGTGCAAGACAGCTACATAAGAGTTTAGAGGTAAAAA +CTCGCTTTAGCCAATGGGTAGAACAAAATTTTAAAATTCTGGAAGAAGGTTATGATTTTACAAGTGTAGT +CGGAACTACGGTTGTAAATAATGGCGCAAATAGAAAATTGCAAGATTATGTACTATCTTTAGATGCTGCT +AAAAATTTAGCAATGGTATCTAAAACTGATAAAGGTAAAGAAGTTAGACAGTACTTTATCCAAGTAGAAA +AGGACTTCAACAGTCCTGAGAAGATTATGGCAAGAGCCTTGCTCATGGCAGATAAGAAAATCACAGTCTT +AACCACAGAGAATGAGACGTTGAAGCTTGAACTTGAAGAAGCGCAGAAACAAGCCAGATACCTTGACTTA +ATCATTGAAAGCAAAGCAAGTTTGCGCGTGACACAAATCGCTGCTGATTATGGCATGAGCGCTACTAAGT +TTAACCATCTTTTGCACGAATTTGGAGTGCAACATAAAGTTAACGGACAATGGATTTTGTACAAGAAATA +CATGGGCAAAGGCTATACAGATAGCGCAACCTTTGATTTCGTGGACGGCAAAGGTCAAGCACGCACTCAT +GTTACGACAACATGGACGCAGAAAGGTCGCTTGTTCTTGTATGAATTGCTTAAAAGCAAGGGGATTCTGC +CTTTGATTGAGCGTGAGGATGATTAGGAAGGGGCATAAATGGGAATTTTTGAAAAAAGGGAGCTGGATTT +AGCTGAGCGTAAAGTCTTGAAAAACGACTTTATGAACCAGTGGCTTGCAGCTATTGCAAGAGACCTCGCT +AAAAACTATGACAACGAAAAAAGCACCCTAGCAAAGTGCGAGATTGCTAAAGTGCTAATTGAGATAAAAC +AGGCTCTTAAATAAGCCAGTCTTTAACTCTTTGCTTAGCTTCTTCAAGCTTTTCTTGATTGTGATTTTCG +ATAAATTCAACGGTTTCTTCGTAAAGTTTGACTTTATCAGAAATACTCAAATCAGGATTCGAAGACGAAA +CAACAGCTAAAGCAAATTTTTCAGCATCTATGCTCATAACATTCACCTCCTCTCTGCTTTCTTTTATTAT +AGCAGAGAAAAAAAGTGTAGAAAGGAACAAACATGAGACCAAAACGTTATCCGTATAGTGGGAAGCAAAA +ATTGTCTATCGTAACTTCGATAGACACCGAAAAATTTTCTAATGTTTTAGATAAAGCATTAGATACTAGT +TTTCAAGTACAAATAGGAGGAAGTAAGCATGAGACCAAAAAAGTATCCGTATAGTTTTAAAAAACAGCCT +ATCCAAAACTTAGATAGACTATTTCACAATATAGAAATCAAGCCAAATAATGCAAATGGTGTTCCGACAG +TTATTCTTGACGGCGTTGATATCGTAAAGGAAGGTGGAGGGCTGGTTTCGGTCAATCTAAATTGGGAAAC +ATTGACTGACAATTCATCAGGTAAAAATACTTTTTCTATTGAATATCTAAACAAAAAAGGGCAAGTTGTA +AAACTTACCCAAGGTGCTATTGGTTTTTAATTAAATCGGAAATAATATTTGCTGCTGTTTGAGACAGAAA +ATCTAATGTAAATACACCTATTTTAGAAGCTCTTTCCTTGGTATCTCTCCAAATCTTAGGACTTCTAACT +GTATCAAGGAATTGATGCCCTTCATAGGTTAGACCCGAAAGAGTTCCATTGTAAAATTTATTATTTCCAA +ACTGAACTTTCCAATAAACAAAACCCGCTTCTTTAAGCATTTTAAGATGATATAAAACAACATTTTTATC +TAACGAGTTTATTCTAGGAAAACGTTCAAAAGAACTTACAACTAAATGTTGGGGGTACTCATGTATTTCT +TCAATATCCAAAAGAATATCGCGAGCAATTTCTGGATCAAACTTCATAATAAAAACCTCGTTTTTTGATT +ACATTATATCAAATTTAGAAAGGACAGAAATGAGAAAACTAAAAAAAGCCTTCGCTATGCTGGATAACGA +AGACCTTGCACTATCGATAATCGGCGCTGTAATCACATGGTTGTTCATTTGGTTATCAAAATGAATTAGC +AAAAAGCCACTGCGGGAACAGTGGCAAATCAAAACATTACAAGGATATTTTATCATGAACGATTTAATGA +TTCAACTACTCGACCAGTTCGAAATGGGGCTGAGAGAAAGAGCTATAAAGGTCATGGCTACTATCAATGA +CGAAAAGCACAGATTTCCAATGGAACTCAATAAAAAACAGTGTTCGTTGATGTTGCTGGGGACTACAGAC +ACCACAACCTTTGATATGCGTTTCAATAGTAAAAAGGACTTTCCTCGTATTAAAGGAGCGCGTGAAAAGT +ATCCACGAGATGCTGTGATTGAGTGGTATCACCAAAATTGGATGAGGACAGAAGTGAAGCAGTAAGAAAT +TGGCTTAACAGCGACTGGCAAGATATTGCCTAGAACATAACCCTAGCTGTAACAGTGAGCTAGTGAGGAA +GCTGAACGATACCAACAGCAACAACGATTTGATATTCATGACTGTCTCCTTATATATTAAAAAAATATAT +GAAAAAAACATCCTCACTAGTTTTCTAGTGCGGTTAGGGAGTAGAAAGGAAAGTAACAATGGAAGAATTC +GGGGTGTTGCTGGCTATGGCAACAATAATAGGCTCGCTCTTATTCGCAATTTGGCTCAATCATTTTCTGT +TTGAGATTGCCCCTTTCGTCCGCGCTTGGGGACGTAAAAATATTTCAAAACTATGGGATAGATTAAAGCG +AACAACGAAACGATAGCTGTGGCTAAAGTGAAAATTTCTTCAGTTAGCGTCATAGCCAAGGAAACCGTGA +AGGCTAGTGCAGTGTAGGTTGTAGCAAAAAGCTTTGCAAACTCTTCTGCATACCTTCGAATAGAGGAAGC +AATTATAAAATACAGCAACGAAACGAGAATAGAACACGAAGATTTTAATGACAAACATAGTAAGAGATAA +AGCAAGAACGATAGTAGTTAAAATGCCAATCAGTTTCAAAAAAATATTTAAAAGTTGTTTTAATAATCGT +CTCATCTTAAACCCAATCTATTTTTTTAAAAACCATTTTATCAGAAAGGAAAACACTATGAAAGCATCAA +AACTATTTAACTGGATTTGGAGCGAAAAACAACAAGAAGAATACTCCTTCGAACCAGTATGGACACCACG +AGAGATTAATGACCAGAAATATGAAGCGCGTCAAAGACGTGAGCGGTATCTAGCTGCTAAGTACCTTAGC +AATAATTAGATCACTAACATCTCTCAGCGTGTAGCCATAGCCCTTCCGTGGAGTGTAACTTATACCCATT +TTTCCCCAAAATATAAACTTTACTTTACCCACATATCTTTCTAAAAACACATTTACAAAGCGGTGGGGCG +ATGGGTGCACGTTGAGAGCACTAAAAAAAGCATGGGTTAGGGCCCATGCAAGAGAAACTCTAAGGAGATT +ATACCATAATGATTAAGAAGTTTGAATTAGATTTATCATCTAAAATCACGGCTTGGGGAATGGAGCTGTT +CAGAATACGAGCGTTGATTTCGTTTGGAGACGTGAAAAAAGGCGATTTAGGCGGGTATGTTGAGAAAGAA +GAAAACCTAAGCCACTCTGGTGGCGCATGGGTCTATGGTGACACATGGGTGACTGGTGACGCTAGGGTCT +TTGGGAACGCCGAGGTATTTGGTGACGCGTGGGTCTATGGGAATGCTAAGGTCTATGGGAATGCTAAGGT +CTATGGCGAAGCTAGGGTGTGCGGTGATGCTGTGGTCTCTGGTAACGCTAAGGTATTTGGTGACGCTGTG +ATCTCTGGTAACGCCAAGGTCTCGAAATTAAACGACTACATCGCTTTCAAAAACAACTGGTCTAGCGGAA +GATATTTCACTTACACACGCTCTAATAAGATGTGGCGTGTCGGCTGCTTCTACGGCACTGGCGAAGAGTT +AGTTGAAAAAGCATACCAAGACAGCGAAAACAGTGGCAAGCACTATGAGGCCTATGTCAATTTAGTTAAA +ACGCTGGAAAAACTGGAAAAATAAATAATAGTAGTCGAAGAGAAACGAAGAAAAAGGAGAATATATCATG +AAACTAACAGAAACACAAGTCGTATTTTACAGTGCAAAAAGGGATGGATTTCTTGGAAAATACAAAGACA +GAGGCAGCCTAGCATTTGAGGCAGGTTTTACTACTGAGTTAAGAAGTGCACTAATTTTACCGCTCGATTC +GTATGAAGAACAAAAAAACGAGCTTGATAAGCTTGCTGAAGCGTTTGGCTGCGAAGTGCTTAATGTGGAA +GTTGAATATAACATAACCAAACTTGACGGTTCTGATTTCGAACGCACAGAGCGTGAAGGACTCGAGAAAG +ATGATATCAAAGCACTCCTAGAAATATTGGCAAAGTAACAAGACAGAAGTGGTGGGAGGGTAGGCGTTAA +ACATGGCAGATAATCAGAAATATTACACAGGAGGCAAAAAATGGGAAACCGTAGAATGATAAGTAAAACT +GTTACTCAGACCCATCGATTCTTACGTTTGCCCCTAGAAACACAAGCTCTTTATTTTCACCTTATTCAAA +ATTGCGACGATGATGGAGTAGTGGAAGCGTTCCCTATTCTCAGAATGATAGGGGCTAACGAGGATAACTT +AGGGCTTCTAGTCATCAAGCAGTTTGTAAAACCTCTTAACGATGAAATGGTTTATTTCGTGGTTGATTTC +CACGAGCAAAACACTGTCAGAAAAGACAGATATGTGCCTAGTGTTTACAAAGAATTGCTAGAAGAGAATA +CCGATGAAACCACTGGTAAACCACTGGTAAACCAAACGGCAACCAGTGGTTGCCCCAATATAAGTAAAGA +TAATACAAGTAAATATAATTTAAGTAAATTTAACAGTAGAGAGGATGAAACATCAGAAAAAAGTCAAATT +TCTTCTTCTGCTGCTGATGACCAATCAGATTTTAATATTTTTGAATATTACCAAGAAAGAATCGGGCCTA +TCGATGGATACCAAATGGAAAAACTAAAAGGCTATATCGATTTTGATAAGTTGGAAATCATGTTGGTCAA +ACGTGCCATAGATAGAGCTGCGGATAACTCAAAACGTGGTTTTGGCTATATCAACTCTATTTTAAAATCT +TGGGCACAAAATGGGATTCATACCATTGCCCAGCAAGATGAAGAGCAACGTAAATTTGACAGCCGTAAGA +ACTTTGATGACCAACCAGCTAAATTCGGTCCAGCTTGCAGCAAATATTAGAGGTGCTGCTTATGAGTTTA +GAACAGACAGCTAGGCAAATGCGAAGGCAGTATATGACCACTAGCGAGAAATACTGCGACAAGCATCAAC +GGCACTATGTCACAATCCAGCTCCCAAACAGCAAACCCTATACCGTATGCGAGATGTGCCATCGTGAGGA +GCAAGCTAAACAGAATGCCATCAAGGCACAAGAACAGTACGAACGTGAGCAAGAGCAGAAGCGACTGTAC +TTTCTCAAAGATTTTAGCTTGATGGATGACGATTTGAAGAATGCCAGTTTCGATAATTACAAGGCGCTAA +CCAGAGAGCAGAAGGAAGACTTGAAGAATGTTCGGAGTCAACTCAGAGGCTATCTTGATGGCCAGGACTA +CAACATTGTCCTCATTGGTGATACTGGTGTCGGCAAGAGCCATCTAGCTTATTCAGCGCTCAAAGCTTTA +TCTGACCACACCAAAAAGATGGGCCTATTTATCAACATTGTAGACTTGCTAGCCAAAATCAAAGAGGATT +TCAGTCTTGAGGCGGAGTATATTAGACGCATTTCGGAAGCTGAGTGGCTAGTGCTCGATGATTTGGGAAC +TGAAAAAGTGACAGAGTGGTCTAGTGGTATCTTGTACAGCATTTTGAACAAGCGTACCAAGACCATCATC +ACGACCAACTTAAGCCCACGAGATATCATGGGTACTTATGGCAAGCGTGTCTATTCGAGGGTCTTCAAGA +AGACAGGACTCGAAACTACGAACGAGCACGTTTACCAATTCAAGACACAGCAAGACAAGAGGATGATGCT +TTGACGGAAGAAGAAGTAAAACTAAAACTCTTTGAAGACTACGAGCGCATTCACGGCCTTGTATTCTCAG +AGGAGCATAAGCAGAAGATGATGGATGAGCTAGATTTATACTCATTCATCAGCAAAATCAACGAATATAT +GTATTTCGCTAAGAAATCAATGCAGATTTTTAGCACACACTAGAAAACCCCTCTAAAATCGATTTTAAGG +CGTGTGTTTTGCTTGGTGGTATAAATAGACTAGAGCATCATTAAAATTGCACTACACCCTCTTAAAATTA +GAAATAAGGGTATTTAAATCAAAAAGGAAGACGAAACATGACAAATCAATTAGCACACAAGGACTTTTTT +AATACACCAGCGGTTAAACAGAAATTCCAAGAGGTACTCAATGGAAACGAGCGACAATTTACCGCAAGCC +TCTTGTCAATCGTAAACAATAACAATCTACTAGCAAGAGCTAGCAACACTTCAATCATGACGGCAGCAAT +GAAAGCAGCAGTCCTTAACTTGCCAATCGAACCAAGTCTAGGTTTCGCTTACATTGTCCCTTACAAGCAA +GACGCACAATTCCAATTGGGATATAAAGGGCTTATCCAACTAGCTATCCGCTCTGGTCAGTTTAAGGCCA +TCAACTCTGGCAAAGTCTATAAAGCACAATTCAAGTCGTATGATCCGCTATTTGAAACACTAGATATTGA +TTTTACTCAACCGGAAGATGAAGTCTACGGCTACTTTGCAACTTTCGAGCTAGTCAATGGCTTTAAGAAG +TTGACATTCTGGACAAAGGAACAAGCAGAAAACCACGGGGAACGCTTTTCAAAAACTTATGCAAGAGGCC +CTTGGTCTACTGACTTTGACGCTATGGCTCAAAAAACCGTGCTTAAGAGCATTTTGAGTAAATATGCCCC +ACTCTCAACAGAAATGCAAGAAGGCCTTGTATCAGACAACCAAACTGAAGATGTCAAATCTGACCCTATC +GATGTTACACCAAAGAATGAGGACACCCAAACGCTTTTAGGTGACCTCATGAGCGATGAAGCTGAATCTG +AAAAAAGCGTAGACGCTGAAACTGGTGAAATCATCGAAGAAGTTAGCTTGTTCGAAGGTGATTCAACCAA +AATCAAAGAGGTAGACAATGACTGAATTAACAATATTGACAGAGGATAATTACTACTCTGATAAAACCTA +TATGTCTGCAAGCCGTTTCAAGGAATACATGAAATGCGAAGCTAGAGCCAAGGCTATCGATGATGGTATT +TGGGAAGATGAGCGCGATCAAAAACCTTTGCTCTTTGGCAACTATGTCCATAGCTATTTCGAAAGTGAAG +AATCACACGAAAAATTCAAAGAAGAGAACAAAAAAAACTTATTCTCTAGCCGTAAACCCTATGGGCTGTT +ATCAGATTTCAAGTTGGCTGAAAAGGTTATCGAAACGCTTAAGGATGACACTCTTTTTAACAAGCTTTAT +CACGGAAAAAAAGGCGACAAAGTCGAAAAGGAAAAGATTGTCACTGGATTCATCGCCGGTGTGCCATTCA +AAGGGAAATTGGATAGCATCAACTTTTCAAAAGGCTATGTGGTCGATTTGAAAACCATGAAATCCATCTG +GACTAAAAAATGGTCTGAGGAATTGCATGCCAAAGTACCAACGGCAGTCAACAACATTCTAGGGTTTCAA +TACCATGTCCAACTAGGGACATATTTAGAGTTGCTACGTCAAATGGACTATCCAACATTCAAACCATTTA +TCGTGGCAGTCTCGAAAGAGGAACAGCCAGATAAAGAAATCATTGAATTGACGGAAGAATGGCTAGACGA +GGGGCTTGATTACATCACTAGACACGCGCCTAGAGCCTATCAAGTAATGCTTGGAAACGAAGAACCTAAG +AAATGCGGTCATTGTGATTATTGTAAATCTCAAAAGAAACTGCATGAGGTTCTAACACTGGACGATTTCT +TAAATCGTGAATAAAGAAAGGAAAAATCAGATGATTAATAATACCGTGCTTGTTGGTCGTCTCACCAAAG +ACCCAGAGCTACGCTACACGCCTAGCAATGTCGCAGTGGCTACATTCAGCCTTGCGGTTAACCGTATATT +CAAAGACGCTAACGGCGAACGTGAAACAGACTTTATCAACTGCGTTATCTGGCGTCAACAAGCTGAGAAT +TTGGCTAACTGGGCTAAGAAAGGCGCATTGATTGGCATTACTGGACGCATTCAAACCCGTAGCTACGAGA +ATCAGCAAGGTCAACGTGTGTACGTTACTGAGGTTGTCGCTGAGAACTTCCAAATGCTGGAAAGTCGCAA +CAGTCAAGGTAATCAGCAGAACCAAGGGAACTCTTTCCAAAATGGAAATAGCTCGAAAGCCGGAAGCGTC +AACAATGGATATAACCAGCAACCGCAACAGCAAACGCCAAACTTTGGGCGTGGCAACTCAATGCAGGGGA +ACCCTATGGATATCAGTGATGATTTGCCCTTCTAATAAAAGGTGATGCAAATGAAGTTTAAACCGATTAA +AGGATACGAGGGCATCTATGAAGCGTGCTCAGACGGGACAATTTGGACGTGCGAAGGGAAGACAACTTAT +AGTAATTGGCACGGAAGAATTAGGAAGCGTGTATGGAAGCGTAGAGAAATCAAACCACAGATACAAAAAC +GAGTAAGAAGCGCCCATAGTGATAAACGAGTGAAGCTGTGGAAAGATGGGAAAGTGGCGACACACTTGGT +AAGTAGATTGGTAGCAACTGCATTTATTCTGAACCCAGAAAACAAAGGGTTTGTAAATCACAAAAACGGA +GAACCGTTAGACAATTCGGTAGAAAACCTTGAGTGGGTGACTAGATCCGAAAATCAAATACACGCCTTAA +AAACGGGGTTAACAAGCGCAAACAAAAAAGTCGTTCTAAAGGACATATCAAACGGCGCAGAGCACCACTT +CAACAGCTTGACAGATGCTAGTTACTTCCTAGGGAGAAATCACGGCTACCTCAGTCTAAAAATAAAAAGA +GGTAAGGGTGTAGACGGCTACGAAGTTAGATTGGTCTAGGTGTTTCATGGAAAAATTGATTTTAAAATTT +GAACTTGATAGAAAACAAATGATCTCAGCGAATGACAGGATGCATTTTCAGCAGAAGGCTAAAATCACAA +GGTTTCTACGACAACTAGCGCATTACGAGGGAGAGAATACTTTAAGAGATTACTTTGGTTTACCTTTTAA +CGAAAAAAAGCCTTGTAAAGTGATTGTCTGGATATTCGCCCCGACAAATCGCAGATACGACCCCCCAAAC +TGGTCACCCACCAGTAAAGCCCTATTAGACGGCTTGACTGATGCAAATTTCTGGACGGATGATAACTACC +ACATCATTAAGTCAACGGATTTCAGACATGGCGGGAAGTCAGGAAATAAGAAATACAGGATTGAGCTTGA +AATTGAGGAGTTGGAATAACAAGGAGGAAAACGACAATGAAAAAATTTAACGGTGCAATGGTTACGAAAT +TCAGAGAAAAATACGGATGGACCAAGACACATCTAGGAGAGTTGTTAGGTGTTTCACAACAATCTATCAC +AGACATTGAATACAATCGCAACAAGACTGAACCAACTCGAGAGTTTCAAAATAACTTGGCAGAAGTTTTA +GGAGTGTCTGTCAGTGACTTTTATAGCGAAGAAAACGATATAGAATATAATTTTAAGCCATCAGGTTCAA +GAAATAGTAGTCCATTCAAGAAAATAGAGTTTGGGATAGAGCAATTTTTAAATTCGTCTAAACAATATGA +TGTCATCGTAGAAGTCGAACGAATTGGCATTAAAAATTCAAGAATGGATGCGTATGATTTCGTTGACCTG +TATGGCGATAGAAGAATAAGAGGAATAAATACAGAAATTGAAAAAGAGGTTACCTCAACATATCGAAACG +ATGAATTGATATACACTGATGAAACATTATCTAGTGTAGTTGTATTGTATGTGAAGGCTAACAAGAAGGA +CAATGAGGAATAAAAATGAAGTATAAAGTAACTGAATATTTCTCAGATGTTCGAGAAGAGCAAACTGGAA +CTTGTGAGCTATGCTATGGGACCGCTTTGGTCGAAAGTGGTTCAATCACAGTTGAAGACGAAAACGGAAC +GGAAACAGAAATCCCATTGACAGACTGGAATTGGGGTGATTTTGACACAATCTATATCGACAATGTGGTT +AATTTCTCTGCATGGTTGCAAGAAAAAGAAGTTGAACCAATCGCTGAAGAGACAAATGATTGGTCGTGGT +TGAATGAGTTAGTAGAAAAATATGACGAGGAGCAGAAATGAATATAGAAGAATTTATTGAAACTATCAGA +GACGCAATTGATTTAATAGAACAACTAGACGAACCACAACCGTTGAAGCTAAAAGATATCACAAGCCGAA +TGAAAGAGCTAGATTCTCATGCTCGGTCAGAATGGATTGATGTAATCTTACACGAATTCGGTGAAGAGTT +TGGTTCAAAAAAATATCGTGACGGATACGAGCAAGGCAAGTTAGAGGGAACTATCGAACATGTTAAACCA +GTCGTACCGCAGTCTGTGGCGGATTGGTATGAGGAAATTAAAGGTGAATTTTACTTAAACTTACATTACT +TGGCTTGGGATATGTTTGAAAGTTTGGACGAAGATGCCTGTGTACCTAAAAAAACATTAAATGACGATAT +CACACGTTGGTATCGCAAAAACGAAAATGCTATCAAAATAATTGTCAACATGCATCAGTTTGGCTACGAG +GTGGAGAAAGAGACGAAGTACACTGTCAGAATCAAAATCACAAATCAATATTTATGCAGCGATGAAGGCC +ACCTTCATTTTAGTCCGGGTTTTAGAACTGATTTTACAAAAAGAGACCTTGAGGGGTTAGGTTTCGGATG +GGTATTTGATTGCGAAGGAATTGAAATCGAGGAGGTGGAATAGATGGCTAAGTTTATCGAAATTGAAACG +TGGTATCAAGGACACTCCCATATTGAAATTTTGAATATAGACGACATCGGGCATATAAGTGTCGGGCCAA +ACCTTATCTTTTTGAAAACTCCATACGCTGACGGCTCAAACGTGACAAGAGTATCGTCTGAAACCATCGA +GAAATTAATGGATATTTTAAAGGTTAAAGAGGTGGGATGATGAACAGACTTAAACGGTTAAGAAAAAAGA +AAAGGCTAACTCTTATGAATTTGTCTAAAGAGTTGGGTTTGCCAGACAGTACACTGTCTCAATACGAGAA +CGGCAAAAGACAAATCAGTATAGGCAAAGCCAAAAAGCTAGCTGAATACTTTGGTGTTAGCGTTGGTTAT +CTGTTAGGGCTTGATACACCAGCAAAGGACGGTATCCCAGAGCTTATCACCAAGGTTAACGAATGGGCTG +ATGACCGCAACCTTAAACAAGCAGACCCTAAGATACAGTGGATGCGAATCACTGAGGAAGTCGGAGAAAT +TCGAGATGTACTCTTGAAACCGACGAAATTCACGGAACCACAAGCAGCACTCAAGGACGCTATCGGAGAC +ACGCTAGTAACGATTATCGTGCTAGCACATCAATTAGACCTTGATGTTACTGAGTGTCTAAGCGTTGCTT +ATGAGGAAATCAAGAATAGAAAGGGAAAGATGGTAAATGGAACATTTGTCAAAGAAGAAGACCTCTAAAC +GAGAAAACCAGCTAGCAGTAGCGACGATTCTGCTAGCGCTATCGCTGGCGATTAACGTGACTACTGTCCT +ACGAGTGGTTAATAGACCTATCGAGATGGTACTTATCCACAAGGCAGATAATGCGGTAGAACTACATGGC +AAGGTCACTGGAAAATCAATGGTAGGCAAGCTCTACACGATTGATTGTGGAGCTTATGGTAAGTTTCTAG +TGAGCAAGGAACAGTACGACCAAGTAAATGTTGGGGATGATATTCCGAGCTATTTGAAAGGACGGGGGCA +ATGAACAAACGACAACGAAAGAAGCAGTTTGTCAGAGAATTCTCAAAACTTTATGACAAGAGTTTGGAAC +ACGGAGGTTTTGAACGAGGGATGTCGATAGCCACTTTCAAGGACATAAGAGGAACAATAAGGATGTTTCT +GACGCTTAACAAAAGCATGAGCTATGATTTTGGTTGTGGCGAGTTGCCAAGTATTTCATTCGATGGGTAC +TGCCTTTGCTATAAAACGCTGAAGAGGTGAGAATAATGATACCAAAATATCGAGCGTGGGATAGAATTCG +TAAAACGATGTATGAAGCGGATGATATTGTGTCTATCAATTTCGGAAAAAGCGAAATTTGTGTAAAAACA +CTCTTTTTTGAACAGGTAAATCGCTACAATTTCGATGACATCGTATTGATGCAATCAACTGGACTAACCG +ACAAGAATGGCAAAGAAATCTTTGAAGGGGATATAGTTGATTCGGAGGGTGGTTTTACAACCGGAGTAGT +TGAATTTAGATCGGATTTAGGGATGTTTGTTAGCACCTTGATTAAATATAATAACTTCGAACGGTTATGT +AATGCTCACGGTTTGGTAAAGGTTATCGGCAACATATACGAAAATCCGGAATTGTTGGAGGTGAACTAAT +GCCTAGTAATTACCCCAATGCTGGACTTACTAAGGAACTATTCCAGCGATATCGTGAGGAAGTGGAAGAA +CTGAGAGCTACTTATCCAAACAGTATCGTGGCACATATCATGGAAATTAAGGGCTGCTCGAAGAGAGAAG +CTAAGAACATCGACAGTGCTATCAGTGTACTCTATGTAGAACATGTTAATCTGACACCTCGTAAGGTGAT +TCAGTTAGAAGGATTGCTATCCAGAGAGCTATTCAGTGAGATAGCTAAGTATGTATTCAATCACTACGAA +TGGCCGGAGAGTCTAGATAGTGAAGTTGACCGTATCACTCTTGAATATCGGACACAGGGGGAGTTGGGAC +GCAACAAGCCAAGCGTTAAACGTTATCTGTATCGGGCTTATGCGCTTGGTGTTTAGGTGGAAAAGAAAAA +AGCCGCAGACTAGTGCGACTCTTTGTTACTCAACATAACTATATTATAGCAAAGAAGGTCTGCAATGAAA +ACTAGCCAGCGATTGAAAGAGTTGAAAGCACTAGACAGATACATAGATAGCCAGCTTGAACGTATCCAAA +AGCTGGAAGCAAGTGCCACTAAGGTAACCGCCGCTTTGCCACAAGCAGACAAGATTTCTGGTGGTATGAA +GCGTAAGCAGGATGACATCTATGTAGAGCTGATTGATGAGGAAGAAGAGGTGAAAAAGCTATGTAAACAA +GCGATACAAAAGCGCAGAGAGTTTTATAATCTAATCTATCAAGTAGACGACTATCAAGCTAGAGATATGC +TGACGATGGTCTATATTGATAAGCTGTCACGCTTTGACATTATGGATAAGTTAGAGCTAACTGCAGACAG +CCAATACTACTATCTGTTAAGAAGAGCGCACAAAAAGATAGACAAACGCTGTTGATTTAAGTAAAACGGA +GCGCAGTCTAAAATCAAAGTGGTATAGTAGTAGCATAAAGAATTGAAACAAAGGCACCTTGGGTTTGAAT +CCCAGAAAAGCTTCTGAAAAACTTCCAGCTTGGGTTACTGGTGGCGACGGAGTAGGATGTTTTAAAGTCG +TGCTAAATAATTACGGGTCCTGCAATGAGTCGAGTCACATCGGAGTCATTGAAAAATAAATGGAAAGGGT +AAACATCTTGTGACGGATGCCTAAAAAAACGATACACAATCCAGGTTGAGTGTATCACGCTTGTTTGTGC +ACCTTTTGGACAAGCGGTAGGAATATAGCTCAGATGGTAGAGCGACAGACCTTTAATCTGCATGCGTAGG +TTCGAGTCCTACTTTTCCTATTACAGTCACACAATCGTGTGGCTTTTTAATTTAGATTTGGAGGTGATTG +ACATAGCTAGAGTTAGACGTTGCAAGTACGCAGGTTGCAGAACCTTTGTAGATATAAGCGACGGGTACTA +CTGCAAGGAGCACGCAGACCAAGCACCTAAGCGTGAGGTATACTCACGTACGAAGTACAACAAGTACACA +CGCAACAGGTCAGAAGATAAGCGAGAGCAATATAATTTTTATCGAAGCAAGATTTGGTCGAGCCTAAGAC +GAGTAGTCCTAGAACGTGACCACTATCTATGTCAATACTGTTTAGCTCTAGGTACTGTCACACCGAACAG +CAAGATAGGTGACCACGTCACACCCTTCGAGGTAGCGCCTGAACTAAGGACGGACCCGAAGAACATTGCG +ACAGCTTGCAGAGCTTGCGATAATGCCAAAAGGACGCTAGAACAGCAAATCTATGGCACAGGGCAAGGTA +ACACGTTGCATAACCAACAACTACGGCTCACGGTCAAAGAATGGGCGCTAAAAATCAAGCACGCACGAGA +AGCCCTATAAAAAGCCCGTAGAGCAATTTTAATTGGCGGAGGTATAATTCATCAAAACAAAATTTAAAAC +GTGCCCCCGCCCCTGTATGAGCCAAGGAAGAGCCACACAAAGGTGTCAGCTTACATCGGACACCAATTTT +TCAGATTTTTAAAGGGTGTCATAGCAGCTAGATAGGAGGTGAGGTGCACTTGGTTAAAAATCCATTTTAT +AAGCAAAATAAAGGGCGTTTACCGAGTGACCCACCAAACTACTTAGGGCAAGTAGCTAGGGAAGTTTGGC +GCAAAGTCGTTCCGTTTTTAGAGGGAACAGGCAAGGTCGAGCGCATAGATACATTCTTGGTGGAATCCTA +CTGCACTAATTACGAAATTTACAAGCTAGCTTACGAGGATATCAAGGTAAACGGTATCCAGCAGGAAATC +AAAAAGCCTGTACAGGCGCAGGGGAGTGGTGAGATTTTAGATGAAATGTCGCTTGGCTTTAAAAAGAACC +CAGCGGTTGCCACGATGAAAGATGCAACAACTACGCTGAATCAGATAGCTATGCAACTAGGTCTTACGCC +GAAAGGCAGGGCAGAGTTGCTGACGATTGCCGATAGTAGCAAGCCTGAAAAATCGACTGCTGAAATGATG +CAGGAATTTTTAAATAGTTAAGCTTGGATTTAAAATCCAAGCTTTTATTTTGTGATAGAAGGAGGTGAAA +GAGATAGATTTAGCAAAAACTCACGATATTGTTGGTGCTTATGGAACATATAACTTTTTTGATATTCGTA +ACGAATACGCAGATCCAGGCACTCAATACGCTTTTGACGTTTTGGATGGTAAGAAACAGGCTGGTTACAT +GATGCAACTTGCTTGCTTGCGACACTTACGAGACTTAAGACATCAAGGCAAACCTGATTTTCCTTACACT +TACGACTTAGCGGAAGCTGGCAAGGTGTTGAAGTTTGCCAAAGTCTGTCCTAACGTGGATACTGGTGAGC +CTACAGCGCTTATGGGTTGGCAAGAATTTTTGCTTAGCCAATCTTTTGGCTGGCGCAATGAAACGGGTGG +TAAACGCTTCTCGCAGGTCATTGTTTCTGTTGGTCGTAGTCAAGGAAAAACGTACATACAAGCTATTTCT +ATGTGCTTTTCTTATCTCTTTGAAAGCCTCGGACTGTCTAACCAAGATTATCTAGTAAGTTCAATCAACT +TCAAACAGACCATGAAGTTAATGGGCTATATCAAGAATATGCTTAAACAGATAATCACTAAAGAACCTTT +TAAGTCTCTAGCTGAAGAGTTGGACTTGTCTATCCAGTCAGAACAAGTCATTATGAGAGCAAATAACAAC +GTTTTAAGGGCAATTTCGAGCGAAAGCGGTAACTATGATGGGTTCCACTTCACTAATGCAATAATGGATG +AGTCGGGTGATTTGAAAGACCGCACGAGCATTTCTAAAATCGTTTCAGGGCAGGTTAAAATCCCGAACCG +TCAATTTATCCAAATTTCCACTGCTTACCCTAACCCGACTTCACCTTTAAGAAAAGATGAACGGATCATG +CAGGGAATTATGGAATGCGATGACAGGTCGGGTGACACCCAGCTTTGTCTTGTTTGGTCGCAGGATAGCC +CAGACGAGGTTTACAAGCCTGAAACATGGAGTAAGTCAAATCCCTTACTAGACCTTGAAAGTGAACATGA +TACGCTTCTAAAAGGTCTTATGGACAAACGAGATGCCGACCTTTTATCGGGGAATTTAAACGATTTTCTG +ATTAAAAACATGAATTTATGGGGCGAACAGGATGAAAATAGCTTCTTGAAGCTGGAAGACATCGAGCGCT +CGGTTATATCGGATTTTGACATCAAAGGTAGGCAAGTTTATATAGGCGTTGACTACTCTATGTTTTCGGA +TAACACGGCTTTTGGCTTCGTCTATCCATATCAGGATGAAAATGGCAATCCTAAGTACCATTTGGAGCAA +CACAGCTTTATTCCGTGGCAACAAGCAGGGTCAATTGAAGCTAAAGAGAAGATGGACGGCATCAACTACC +GAGACTTGGCAGATAAAGGATTCTGCACTATCACAAGCCACCCGCAAGGGCTTATCAATGATGATGAGGT +TTACCAGTGGTTGTGCGAGTATGTGGAAGATAACGAATTGCAAGTGCTTTTCTTTGGCTATGATAGCATG +GGTGTCTCTAAAGTTATTAAAGCTTTGGAACTTAACACCAGTTATCCATTAATGGCTATCAGACAGCGCA +CAAGCGAGCTGAAAGATCCAACCAAATTCTTGCAGACACTTTTTATTGAGGGTAACTGTACACGGCTTGA +TGATGAAATCATGGAGAAGGCGCTGGTTAATGCGGTTATCAAGGAGGATAATATTGGTATTCAAGTAGAT +AAGAAGATGTCTACACTGAAGATTGACGTTGTGGATGCTCTGATAGATGCACTTTACCAAGCTATGTTTC +ATTTTGAAGACTATGGACTAGCTCAAAACAACTCGTACATGGTGCAACATATGTCACAGCAAGCGGTGCT +TGATTGGTTTAACAACCCAGAAAGTGGGCTTTTGGAGGAAGAACTTTACGATTATGACGATTTTTAAACA +ACTTTTCAGCCTATTATGGGCTTTTTTTGATGTGATTATGTTTTTAGCGGCAGCTATAACAATCAACGTG +ACGATGTATTTTGTAGGCTGGTTAGCGTTTGGTATCTGCTTAACAATTACATTCATTTTAGCCGGTTTAG +CTAGTGAACTAATTTCTGGGAAGGGAACTGAATAATATGTTATCAACGATTCTTAATATGGTGCTGATTG +CGCTAGGTTTAACTGCATTCTTATCGCTTCTCCTTTTGAGCGTTATCCTATTTATCATATCAGGCGTGGT +AATTTTCGGTGTCATTGACGCAATCGCAAAAAAAATAAAGTGCAAGTAGTAAAGTTCGTTTTTAGAAAGG +AGGTGAAACTAATTGCCTATATTTAATTTTTTAAATCAAGCAACGGAAAGCCCACCACGAGGCGACCCGA +ATGTTTTTTTTAGCGCAGATGACTACGAGTTTTTAAAAGCGAACCTGACTGGAAACGAGTGGGTTTCTGC +TAAGACAGCTCTACGCAATTCGGATTTGTTTAGCATTATCAACCAGCTATCGTCTGACCTTGCGACGGTC +AAGCTCACAGCGTCACGCAAAAAGAACCAAGGCATTTTGGATAATCCAACGAACAATGCTAACCGGCATG +GCTTCTGGCAGTCTGTCTACGCCCAACTTTTGCTAGGCGGTGAGGCTTTTGCTTATCGCTGGCGCAATGA +AAATGGCGCAGACGTCAAGTGGGAGTTTGTGAGACCGTCCCAAATCAGCTATAACGCCTTAGATACCAAA +GATGGCCTATATTATAACGTGACCTTTGAAGACCCTAGGAATGCTCCTAAATTGCATGTCCCACAAGGGG +ACATCTTACATTTTAGGCTCTTATCCGTGGACGGTGGCAAGTCTGGAGTTAGCCCACTCATGTCACTGGG +CCGAGAGTTTGAAATCCAAAAGGCCAGCGACAAGCTGACCCTAAACGCTTTGAAAAACTCTCTGAACGCT +AATGGTGTCTTGAAAATCAAAAATGGTGGTTTGTTGGACTTTAAGACTAAAATGGCACGGTCAAGACAGG +CACAACGTCAAATGACGGGCGGACCGTTGGTGCTAGATGACCTAGAGGATTTCCAACCGCTTGAAATCAA +GTCAAATGTGGCTAGTCTGCTTAGTCAGACAGACTGGACAACCAAACAGTTTGCTAAAGTCTACGGTCTC +CCTGATAGTTATTTGGGTGGACAAGGCGACCAACAATCAAGTTTAGACATGATTAGTGGTCAGTATGGCA +AGGTGGTCAGTCGCTATCTACGTCCTGTAGTCAGCGAGTTAGTCAATAAGCTAAGCACGGATATTGACAC +AGACCTGTTTCCAGCCATTGATCCACTCGGTACTGGGTACATTTCGAGGGTTGTCAATTTGGCAAAGAGT +GGTGTTATTGCGCAAAATCAAGGGCTTTACATGTTGCAACAAGCTGAAATTTTACCGCAAGAGCTACCAG +AGCCAAGTAATCCTAATAATGTTGTTCGAACATTGAAAGGAGGTGAGGAAAATGGGAAAGATTGATATTA +AAGGCGACGTCGTTGATGACATGACCGCTGAATGGTACAGTTACTGGGGCATTGACTCGGTGTCGCCAAA +GGCTGTCCAATTGGCGATTGAAAACGATGAAGACGATAAAATCACGCTAGACATTGCATCAAGTGGCGGT +GATGTCTTTGCAGCAAGCGAAATCTACACGCTTTTGCGAGCCTCTGGAAAGCAAATTACAGCTAACGTCC +AAGGCTTAGCAGCTAGTGCAGCTTCCGTGATAGCCATGGCTGGAGATACTGTACGGATTAGTCCAACAGC +TCAAATCATGATACACAAGGCGTCTAATGGCAACATTGGCAACGCTGACAGCATGCGCAAGAATGCGGAC +ACGCTAGATAGCATTGATAGTTCAATTGTCAACGCTTATGTTCTTAAAACAGGCATGAAAGACACGGATG +TTTTAAAACTTATGCAGGACGAAACGTGGATGAACGCCCAGACAGCAGTTGATAAAGGCTTTGCGGATGA +AATCATGTTTGTTAACGAAGACGATCCAGTCTTTACGAATTCGTTGCATACTATGCCGTCGAAAGAAAAA +CTCAATCAGTTCTTTAATATGCGCCTGAAAGAGAAACAGGCAGCCATTGACAAACTGGAACACAAACCAA +ATAGCCAGTCTTCCAACTCATTAAGAGAACAGAAGCTGGCTATTTTGCTAGACAAAAATTAAAAGGAGAT +GATTAAATGACAAAATCAGTAAACGAGCTTAACGCTCTATGGATTGAAGCAGGCCACAAAGTAGAAGACC +TGAACGAACAAATCAACACAGCACTGGCAGATGACAAGTTTTCTGCAGAAGCTTTCGCAGACCTCAAAGC +ACAACGTGACGATGCAAAGGCACGTCGTGACGCTCTTAAAGAGCAAATGGCAGAAGCGCAAGCACAAGCA +ATTATTGAAGACCCAACACCAGCTGCACCACTTACAGACAAAGAAGAAGCTACAAAAGCGCAATTTGTTA +CAGACTTTAAAAATTTAGTTCGTGGTAATTACGCACAAATTAAAAATATGGTTTCATCGGATGAATCTGA +CGGTGCAGGTCATGCTGGTTTGACTATTCCAAAAGATATTCAGACCACAATCCACACTTTGGTTCGTCAA +TATGATTCTTTGCAAGGATACGTAAACGTGGAATCTGTTTCAACAACCTCTGGTTCTCGTGTCTATGAAA +AATGGTCTGATATTACAGCACTTGCTGAAATCGACGAAGAAGGCGCAAAAATCGGCGATAATGATGACCC +ACAATTAACAACCATCAAATATCTCATCAAGCGCTATGCTGGTATTTCTACAATCACTAATTCACTGTTG +AAAGACACTGCTGAAAACATCATTGCGTGGTTATCTAATTGGATTGCTAAGAAAGTGGTTGTTACTCGCA +ACACCAAAATTATCGCAGCTATCGACACATTGCCAACTAAACCAACGCTTGCTAAATGGGATGACATCAT +TGACCTTGAAGCAAAAGTTGACCCAGCCATCAAACCAACATCAATGTTCTTGACTAATACATCTGGTTTC +ACAGCGCTTAAAAAAGTCAAAGATGCAATGGGGAATTACTTGATGGAGCGCGATGTTAAATCGCCTACAG +GTTACGTTATTGACGGCTTCCCTGTCAAAGAAGTTGGTGACCGTTGGTTGCCTAACAAAGCTAACGCACA +TCCGCTTTACTTCGGTGATTTGAAGCAAGCAGTCACCTTGTTTGACCGCGAAAACATGTCGTTGCTGGCT +ACAAACATTGGTGCTGGAGCGTTTGAAACAGACACTACTAAAATCCGTGTCATTGACCGTTTCGATGTCC +GTACAGTTGATAGTGAAGCCTTTGTCCCTGCAACATTTACAGCGATTGCAGACCAAAAGGCTAATTTGAC +AACTGGCACTGGAGTGTAAGCCTATGACGGTCACGGTTGAAGATATGCGCGTGATGCTCAATTTGGACGA +TGACGAGGGGGAAAAACTCTTGCTCGTCTATATTGCATCAGCGACAAGTTTTGTTAAAAAAGCAATCAGC +ACAGAGGCGGACGACGCCTTTTTTGACCGTGACGATGTCGCACCGCTCTTTAAAACGGCGGTAATGGCTC +GCACGGGCACACTATATACCTACCGTGTCGACACAGGCGACAGCTCAACTTATCCAATCGACGCCACCAC +AAATAGCATTGTGGGACAGTTAAGAGGTGTATATGCAGTGTATGCAGAGGAGGAGGCAAATGGCTAAAAC +CTTTTTACCATCCGAATTCAATAGGGTGGCAGATTTTGGGACGACAAAAACCGTGGAAAATCAGTATACG +GGTATATCTATTCCAAAATTCGTGTCGCTTTTTAAATTGCATTATAAACCTCATACTCGCACGCTTAATC +AGCAATATCAAGCCACACAAGCGAAGTTAGATGATACCAAGGTAATTATAGTAAGACACAATAAAAAGCT +CACGGAGAGCCTGCTAGTGACCATTGACGGTATACAGTACAGCATCGTGTCAATCAGTTCAGACGAAAGC +TTTGGATTGAACAAATATGACTATATCACCTTACGGAAAACTAAGAAGGTGGGCTGATTATGGCTGATTT +TCCTAGCGCATTGGAAGAGTGGGCTAAAACCGTGCAAAATATGGTAGAGCTTACGCCGAAAGAACAAGCT +GAAATTACTAAAGCAGGGGCAGAAGAATTTAAGAAAAGGCTGGAATCTGAAACAAGACAGCGTCACTATT +CATCACATAAAGATCCCGTTTATGGGCATATGGCGGATGGATTAACCTTGCAAACTAAAAACGTTGATGG +CGTCGTAGATGGCAAGTCAACTGTAGGCTGGGAGAATGCTTTCCACGCCACAAACGCAAGACGTTTGAAC +GATGGCACAAAGAAGTACAAAGCTGACCACTTTGTGACCAACGTGCAAAATTCGGCGGAAACCCAAGAAG +CTGTTCTTTTGGCAGAAAAAGCGGAATATGACCGCCTCATGAAGAAGAAAGGAGCTAGTTAATGTCCGCA +GTTATGGACGCAAAGAAAATTCTGCAATCGTCTGGACTAGAGCAGCTAGAGTTAATCTATGCTAGCAATA +TCCCGAAAGAAATGCAGGATAATACCGATAAGACAATCGCGCTCATCACGGACGTTGACATGCGCCTTGA +CCTTGATGGGAACGACACATTCCACGGAGCTGAAAGAGAGGTAGAAATACAACTCTTCTATAAGCTCGAT +ATTGATTTTGATCTAGATAGCTTTGAATTTGCTTTGCTAAAGCTTTTTAGAAACAATCACTGGTCAATTG +CAGACATTCGAGAGCATACAGTAGACCCCGATACTTTACAAGTGACGTGGGTCTTTTATGTTGTCGAACA +TAAGATTTTAAATTAAGAAGGAGAAACTAATATATGGCAACAGTTGGTATTAAAATGGTTACGTTAGCGC +TAGTCGACGATAATCAGAAGCTTATCAAAGGGGAGGATGGTTTGTCAGCAAGCGGCTTAGTGCAAATTGA +TGACAGCATGCTTGGGACGAAAACAGCTAACATTTCCAATCTAGAGGGCTCTGTTACTAAAATCCCGGGT +AACAACAAAATTCAAGAATCGTACACTAATCCATCAGCGCCGCAAGTCGCACTAGATTTTAATAATTTAG +CTTTTGATATTAAGCAAAAAGCTAAAGGTATGAAGTCAGACGGAAAAGGTGGATGGGTTTATAGCGGTAA +AAAGCCCCGCGTGGCAATGTTGCTTGAGTCCGAAACGCTCGACCGCAAACACTCTATCTATACAGGATTT +GGTGATGGCATCATGCAAGAAACGACCGCCAATCACGGAACCGACACAGACACAGCACAAACCCGTGCAA +ATGACATTTTGACTTATATCGCAAACTCAACGGTGGCGTTTAATAATCAACCTTATAAAGTTTATTTCAG +CGGAGATGAACACTTTGATAAAGCTAACATGCTCAAGGAAGTTTTCGGTGGCTATGCAACTAGCGTGGCA +GAACATCAATAATTTTTAAGGTTGCATTTTAAATGCGACCTTTTTGTTTTATGTAAGGAGAAATCATGGA +AGTTAAAACAATTAAAATCCCAGAAATTGCTAAGAAGCCTTTCCAATTGCTGACAACAAACCGCAACATC +ATGCGTATGCAACAGTACCAACTCGCTGTTTTAAAAGTTGGAGAAGACGTTGGCGAAGAAGACGTTGCTG +GTCAAACTCAAGCTAGTTTAGCAGTTTTGGAAGAAATGCTAAGCTTTATCCGCGTCATCCTCAATCTGGA +CGATGAAGCCTATGAAAAGCTTTTGGATATGCCTAACGACCGCACACAGGAAGTGGTTAATAAACTTGTG +GGTTATCTCTATGGTTTGTCAGACGAAGACATGGCAGAAGCGGACGTAGAAAACCCAAAGGAAGAAGCTT +AGGCGAACAAATTTTTGAGCTTGAAAATAAAATTGAAGACATGAAACTGATAGCCAAACAGGCCCTATCA +GCATACGGCTGGACGTTGGAAGAATACTACGAAACAGACTTTTACGACCTCATGAACATTTTGGGAGCGA +AAGAAGTCAAGGATAGACCAGTAGACCCGATGTCTTTGCTGAAATAAATGGATTTCAAATCCAAAAAATA +TCTCGGAAAGGAGGAAAAAATGGATAAAAAAGTGCAAGCGACCATGTCGACCGAGATTGCTCTTGACCTC +GTGAAAGCAAGCGAGAGCATTAAGAGCATGACTCAACTGGTTAAAAGCTCTACTCAAGCATGGAAAGCGC +AAGAAGCACAGCTTAAAAGCGCAGGAGATAGCTTAGGTGCTGCTAAGGCTAAATATGATGGTTTAGGTGC +ATCAATCCAAGCCCAAGAAAGCAAGATTGAAGCCTTAAAACGCAAGCAATCTGAGTTAAAAGGGGATACG +CAACAAACCGCTGAACAGTATCTTAAGTATCAGCAACAGATTGACCAAGCGACTGCAAAGTTAGCTAGCA +TGGAAGCCCAGCAATCCAAGGCTAAGCAGTCTATGGAATACTATTCAAGCGGTTTGGCAGGCTTGCAGAC +AGACTACAAGAAGATGAACGAGCTGTCAGATAGTTATGTGAAACGGCTTGAAGCCGAGGGTAACAAACGA +CAAGCAGCGCAAGAAAAAGCTAAAAATCTCAAAGAAGCTACCAAAAATCTAAGTAAGCAATACAAATCGC +AAGTTGACGAGCTTGAGAAAATCAAAAACAAAGTAGGCGCAACTAGCGAAGCTTACCACAAGCAAAAGAT +AAGGGTTAACGAGACGGCTGCGGCTTTAGCAAGTTCAAAAGCCAAGATGAAAGATGCCCGCGAAGAAATG +GAGAGGCTCAATCCGACTATTTGGACTCGCATGCGGGATTCTGTCAAGAAGTTTAACAATGAAGCGCAGA +AAACAAATAAAATCGGTAGTCATGTTAAAGACTTTGTAACTGGAAATCTGATTGCAAATGGTATTACCAA +CATCACTTCAAAAGTGGTCGGATTAGCTAAAGAGGGCTATGCCGCAGCAGAAGCAGCGTCCAAGACCGCC +GAACGTTGGCAGAATTTGGGATTTGCAGAAGAAGAAATCAAGAGGATCAACTCTACTGTTAAAGACTTAA +AATACAATACGAACCTTTCTGGTGGTGCAGTTGGTGATCTGATTCTGAAATTTCACGGAATTACTCACAA +TGTAGATGAAGCAGCGGAACTTGCGAAAGGGGTTGGTAGTCTATCTGACCAGCTTAAACTCTCACAAGAG +AGAGCAGAAGCATTTGCTGGCGGATTAGGCAAGATTGAAGCGTCAGGAACAGTCACAGCTACATCTTTAA +ACAAGCTAGAGAAACAAGCGCCTGGATTAGTCCAAGCGTTACAAAAAGCGTCTGGATTGTCAGAAAAAGC +ATTTTCAGACTTGCTTAACTCTGGCAAGATGACCTCTAAACAATTTAATGACATCTTAAAGTCTGCGGGC +AAAAGCTACGAAGAGAACGCCAAAAAATACGGCAATACAGCTGAGGGTGCAAAGAAAAGAATCACGTTAG +CGTGGGCGGACACTAAAAAAGCCCTTATGAAGCCCCTTGTAAACGTTGCTTCAACCGGTTTTAACCAATT +AGCAAATGTCTTGCAGAATCCTGCTATCCAAAGCGGAGTAACAAAAATCGGTGAGGGTATTAGCAAGATT +GCGCAACACGCTACGAACCTTTTAAATTACATAGCAGCACATCAGAAAGATGTATCTTCTATCGTTGGTA +ATTTGGTAGAAATCACGAAGTTATTCGCATTAGGCGTTTGGGAAGGCTTTAAAGCTACTGTCACTACTAT +AGCTGATGTCTTTAATGATTTAAGCGGTCATAGTGCCAAGGCTAAAGACCCGCTAAAAAGCGTATCTACT +TTTTTAAAAGAGGTCGGTAAACACAAAAAAGCAATTGTCGCAGTTGGCAAAGCTTTTGCTTTTTACTTTA +TCGGGTCAAAGACAATAAAAGGGATTGCGTCTCTTAGTGCTAATGTTTTAAAATTTGGCAATACATTTGT +GTCAACAATGAAAATGGTAGGAGCTGCAGCCGCCACAAACCCTGTCGGGGCTATATTAATAGGTGTTACT +GCTTTAGTAGCAGGATTTACTTTGCTTTATAAGCACAACAAAAAGTTTAGAGATTTTTGTAACGGGATAG +CAAGTGGTGCTAAAAAAGCATTTGACGACGTTGTTAAATTTGCAAAACATGCTTGGGACGCAACAACAAA +AGCCTTTAAAGGCATTGTCAACTTTTTTAAAAAGGACTGGAAAGAGCTATTGCTTTTTATTGCTAATCCT +ATTGTCGGTGGTTTTGCGCTTATTTATAAGCACAATGCTAAATTTCGCAAGTTTGTGAATGACTTGCTCA +AAAAAGCTTCAGACTTCGCCAAAGGTTTAGGTAAGTGGTTTGGGGATGCCTTTAAAAATGCTAAGAAAAC +CGTTGATAACGGCATCAAGGCTATAACAAAAGTCTTTAAAGCTGGTATTGATTTCTTCCGCAAAGACTGG +AAGGAAGTCCTGCTTTTCATTGCCAATCCTATTGTCGGTGGTTTTGCGCTTGTTTATAAGCACAACAAGA +AGTTCAAAGACTTTGTTGACAATATTTGGGAAACGGCCAAAGATTTCGGCAAGAACATGGTTGATGGTGC +TAAGAAGAAAGTTGATGAGTTTACCAAACCAATCAGAACGGGACTTGACAATTTACATGACAAGTTTACG +GATATTTTCGACAAAATCAAAAGCGGTTTTACGGATTTCTGGAACGGTCTCAAAAACCTAGCTGGCGACG +GTATCAATGCAATTATCAAAATCCCAAATGATGGTATTGATGGTATCAATGGTCTGATTGCCGATTTTGG +TGGTTCAAAGAACGCCATCGCTAAAATCCCTAAAGTCAAGTTTGCCGAAGGGACGGGAGCTTTTAGCGGA +TACCGCAATGCCATCACACGCCCGACGCTTGCCACCCTAAACGATGGTAATGACAGCCCTCATACAAACA +ATCAAGAGTTGGTTATCATGCCAAATGGTCAAGCGTTTATGCCCCAAGGACGTAACGCTCAGATGATTTT +GCCAGCAGGCGCTGAGGTGTTAAATGCCCGTGAGACAGCTATGCTTCTAGGGTTATCGCAAGGCGCTTAT +GCCAAAGGTACAGGCTTCTGGTCTAAAGTTTGGAATACCGTGACGGATGTTGCAGGCAATGCATGGGACG +GTATCAAGGATACTGTCTCTAAGTTCACTAAAATGTTGGAATTTATTGGTAGTGCTGTAACCGACCCAGT +CGGAACACTGGCTAAAAAGTTCAACCCAAAATCTGACAAACTAGATGGCATGTTTAATCCTTTAGGTAGC +GCCTTGTTCAAGACGCCAATCAAAGAAGCCCAAAATTGGTGGAAAGAGCTTTGGTCAATGGCTAAAAGCG +CATCTGATGAAGCGTCGACGGTTGCTATGGGAGCTATGGGAGACGACTACCCAGCTCATTTGAAAGCTGG +CGCTGTCTGGTCGAGTACTGACCCATGGGGCTATTTCGTCAAGGAGTGTGTCTCTTTCGTTGCTTCTCGT +CTTAATAACTTAGGGGTTAATCCTGCTCTATTTAGCCACCTCGGCAATGGTAATCAGTGGGGCAGTGCAC +GAGTGCCACATTTAAACAGACCTAAACCTGGTACAGTTGCTGTTTATACTGGCGGACCTGTATCAAGTAA +TCACGTTAGTTTTGTGACGTCTGTAGATGGTGATACATTTTCAGGGGAAGAGTATAACTGGATGGGCAAT +CACGCCTACCACCAATACTCAAACAGACCAATCTCAAGCGCATCTACATTCCTTGATTTTGGAGTGCGAG +CACCAGGAACAAGCGGTGATGGTGATAAGGCTTTATCAGAAGCTAACTCACCATTACAAAAACTGATTAA +GTCGCAGGTCGGAGGCATGTTCGACTGGATTAAGAAGTTTCTAGGTTTTGAGAGTGGGACGGCTTCTGGA +CCTAACCCTCAAGGTACTGGTGTGGCACGTTGGCGAGATACTGTTATCAGAGCGCTTAAAGCGAATGGTT +TGCCAGCCACCGACCACCAAGTATCAAGTATGTTGCAGCTTATCCAACGTGAGTCAAATGGTGATCCAAA +CGTGAAAAACGGTTGGGACATCAACGCTCAAATGGGCAATCCATCTATTGGGCTTACTCAGACGACTATC +GGCACATTCAATGCTAATGCTTTTCCAGGACATAAGGACATTCGTAATGGGTATGACAACCTGCTAGCGT +CAATCCATTACATTCTTGGGCGCTATGGTTCTTCGGATGCAGCCTTTACACGAGTTGCGAAATACGCCTA +TGCTAACGGTGGACTGGTGTCTCAACACGGCGTATATGAGCTAGCAGAGGGTAACATGCCAGAATATGTT +ATCCCAACGGATATTGCCAAACGGGGTAGAGCGTGGTCGTTGCTTGCGGAAGTTGTTGGCAAATTTGCAG +GTCAAGCACCACAAGAAACCAGTGGGCATAGCGATGACAGCGCATTGAAGCGCCTCGAAGCTAAGTTTGA +CACAGTCATTGGATTGTTGACTCAATTGGTTGCAAATGGCACAAATCCTATCGTGCTTAGAAATATCATT +GATGGGCAAAGTCTAGCAAACGGTCTCGCGCCTTATGCTAGCACGGCTCAAAGCAATTATAATAGCCGTA +TGGCTAAATTGAGAGGTGAGATTATTTGGGAATAAACATGAGTTTCGGTGGTGTTGACATCACCGAAGAA +TTAGAAAGGTTGGGTGGACTAGCGGATGTAACGAGCGCCTCGCGTAATATAGCTAGCAACGTCAATAATA +CCTACCAAGAACAAGGCTCTAGGCGCTATGGCCAAACCCTCTTTTATAGCACATTATCCGTTAAGGCTAT +CACAGTAACTATCAAGTTAACTGGTATGTATGACTTTTTTAATGCTGTCCAAGAAAAATTGGGTGGCATT +TTAAATGCTCTTGATGAGAAAGAGCTTATCTTTGGGGATGAGCCTAACAAGGTTTGGATGGCAACATGGA +GCGGTCAACAGACTGTAACTGTTGATGACTCAACCTCCCCACCAACAGCAACAGTCACGTTAAACTTTGA +TGTCCCAAACACCTATGCGGAAAGCAAGACAAGCGCTAGTATAAGCACCAGAGGCGCTAATAAGTTTGGT +TCTATTGTTAAGCGACCAGACGGCAGCTTCAAGGCTACAATTAACAACTTTGGCACGGCCGAAACACAGC +CGACAATCACTATTAAACATAATAGCGAGAATGGATATATTGGTCTTGTGAATGCTAGCGGTGCGAAAGC +AGTTGGAAATGAGGAAGAAGCGGACAGCAAGCCTGCCAAAAAATCTGAAATCCTGTTTGACTACGTGTCT +AACAACTGGATAACGAAAGGTCTGTCAGATGGATTGAAAAACGTTGCAGTCCTAAATGATAATAGTTGGG +TAAAAGATGGAACACTGTATATTGACAACGCTTGGGGACGTCCTCACATCGCTTTAACTGGAGACTCTCG +TAAGTCTGGTATGCACTCTGGCACGTTGACTTGGGACATTCCAGCAGACAGCCAAGGACAAAAAGGAGCA +GTCTATGAGTATTTTTGGTGGCGTCAAATCTTTTGGCTTGGTTCTGCGACGCAATGTGGCTCCATCCAAG +TTACTGTAACGGACGCAGACGGCAATTTTCTATACGGGGCTGAAACTATCAAACGTCGTGCTGGAACATT +GACAACAGAATATAACATTTTGGTTACTGACGGTAAAGGTGGCTATAGGATACTGGAGTCCTACACATTT +TGGGGAACTCACTTAGATAGTCAAAACCCCTTTAATGCAGAGCGTGGATGGTCCGACTTGCTAAGGTCTG +ACGACCAGCTACGGATTTTCTGGTGGGGGTCATATCCAACACGAACAGTGCCAGAACTTAAAGGTAAAAG +GTCTGCTAAGCTCAATGTTACTTTTAATGTTTGGGGCGACCACCCAGCAGTTACCCACATGTATTTAGAT +AGCATTGTTTATCGTAAAGACTATGTCGAGTACCAAGAAGACATCCCTAACCTCTTTAGACCAGGGTCAA +CCGTTGTTTTCGACATGGCCAAGGATAAAACCTATATCGACAACTTAAAAGCAAGCGACAAGGAAGCCGA +TGGGGCGGTACCGCTAACTATACCAACTGGCACAAGCGAACTGGACTTGTACTTTTCGAGCTGGATTGGA +AAAGACCCTGAAATCACCATCGAATGGAAAGAGAGGTATATTTAATGCAAATTACAGTTTGCGATAAAAA +TTTAAAAAAGCTAACCGCTTTAAATAACGATTTCCCACAAATGCTCTCTTTCTCTGCGGATACTTGGCAT +AGATACCGCGAGGATGGTGTTTCGACCTTTGACTTGACTGTCTCTAAATTCAGAGGTGGTAAATTGCACG +AGGATATAGGTCTTATCACTGATGATGTATACCTTAAATTTAATTTTGATGGTGATACTCATATCTTTGC +TATCACAAATATTGATGAGGATGATTTTAGTCTCAAAATCACCTCAAACAGCACGCTCTTGGAATTTACC +AACGAGCTGGCCAATCCTTTTGAAAGCACTAGCGCTCAAACTATTGCATGGTACATGGAAAAGATGGAAT +TGCTAGGCTTTGCTGGTGCAGAAATTGGGTTGAACGAAATCTCTGGCAATAAGCGCACACTGAAATTCGA +CTCGCAAGAAACTAAGTTAGCACGTCTAAAGTCCCTCATCTCTCAATTCGATGCGGAGTTTGAGATAAAG +ACGCAGGTTAATAAAAGTGGCTCATTTAAACGCTACGTCATCAATATCTACCACGAAGCGGACGACAGCC +ATCACGGCATCGGAAAAGTTCGTGGAGATGTCACCCTTCGCTATGGCCGTGACGTCAAAGGTGTCCAACG +CACTGTAGATAAGACGGAGTTGTTTAATATGGGTATCTTTACTGGTGCTAACAGCTTGAATATGGGTGAT +TATGTACGCTCTGACAAAGACGAAAACGGCGAGGAAGAATTCTACACACGCAAGGGCAATATAGCTGTAT +ACGCTCCAAAATCAGCCAGAATGTACCCTGCTACGCTAAGGGATGGCGATAATTGGACTAGGAAGGATTT +TCAGACAGAGTATACCAATCTTAACGATTTGGCAGCCTATGCTTTTAAAACACTGAAGGCATACGCATAT +CCTTTAGTGACCTATACAGTATCTATCCAATCTAATTTCTTGGCAAATTATGGCGATTTGGCACTAGGTG +ACACGGTTAAAATTTACGATGATAATTTTAACGGCGGATTGATTCTGACAGCACGCATCAGCGAACAGAT +TATCAGTTTTAGCAATCCTAACAACAACAGCCTAGTCTTTAGCAATTACAAAAAGCTGAAATCTCAAATT +TCACCTACTTTGCAAACTCGAATGAAAGAGATAGTAGAAGCCTCAATTCCCTACACTATCAAGGTTGCTA +CCGACAACGGTGTCGGTTTCAAAAACGGTCAAGGTCAGTCCGTGGTTACTCCAACCCTCACGAAAGGTAA +CAAAGTCATCTCCAGTGGCTGGCGCTGGGTCATCGATGGTGTTATCAAATCCACTAGCCCTAGCTATATT +GTTAAGGCCGCTGACATCAACCAGACAATGGTTTTGACAATAGCGGCATGGGTCGATAACAAAGAGGTAG +CCTCTGAACAGATTACCTTTATCAATGCTGTTGATGGCGTGGCAGGAGCGAAAGGCGATAAGGGGGATGT +GGGTCCTCGTGGACCACAGGGCGAACGTGGCTTACAAGGTATTCAAGGACTCCAAGGCCCTAAAGGTGAC +CAAGGTATTGCTGGCGAAAAAGGGGCTGA diff --git a/non-regression-tests/data/n8_1.fq.gz b/non-regression-tests/data/n8_1.fq.gz new file mode 100644 index 0000000000000000000000000000000000000000..97e2e7dcf5ead15033210e783171d830b8568185 Binary files /dev/null and b/non-regression-tests/data/n8_1.fq.gz differ diff --git a/non-regression-tests/data/n8_2.fq.gz b/non-regression-tests/data/n8_2.fq.gz new file mode 100644 index 0000000000000000000000000000000000000000..f79d41519c3bfb01d9d41fc018ea3f28fc2bbd7e Binary files /dev/null and b/non-regression-tests/data/n8_2.fq.gz differ diff --git a/non-regression-tests/n8_cohesive-sequence.fasta b/non-regression-tests/n8_cohesive-sequence.fasta new file mode 100644 index 0000000000000000000000000000000000000000..3c8865c38337cf7966a8ca02c6a288a7e7e580e7 --- /dev/null +++ b/non-regression-tests/n8_cohesive-sequence.fasta @@ -0,0 +1,4 @@ +>n8 cohesive sequence (Analysis: Statistics) +CCACACAAAGGT +>n8 cohesive sequence (Analysis: Li) +CCACACAAAGGT diff --git a/non-regression-tests/reference_results/res_n8/n8_cohesive-sequence.fasta b/non-regression-tests/reference_results/res_n8/n8_cohesive-sequence.fasta new file mode 100644 index 0000000000000000000000000000000000000000..3c8865c38337cf7966a8ca02c6a288a7e7e580e7 --- /dev/null +++ b/non-regression-tests/reference_results/res_n8/n8_cohesive-sequence.fasta @@ -0,0 +1,4 @@ +>n8 cohesive sequence (Analysis: Statistics) +CCACACAAAGGT +>n8 cohesive sequence (Analysis: Li) +CCACACAAAGGT diff --git a/non-regression-tests/reference_results/res_n8/n8_sequence.fasta b/non-regression-tests/reference_results/res_n8/n8_sequence.fasta new file mode 100644 index 0000000000000000000000000000000000000000..539c7e191a8ea61c0edbb1a6363eea081005cc40 --- /dev/null +++ b/non-regression-tests/reference_results/res_n8/n8_sequence.fasta @@ -0,0 +1,725 @@ +>n8 sequence re-organized +GTCAGCTTACATCGGACACCAATTTTTCAGATTTTTAAAGGGTGTCATAGCAGCTAGATA +GGAGGTGAGGTGCACTTGGTTAAAAATCCATTTTATAAGCAAAATAAAGGGCGTTTACCG +AGTGACCCACCAAACTACTTAGGGCAAGTAGCTAGGGAAGTTTGGCGCAAAGTCGTTCCG +TTTTTAGAGGGAACAGGCAAGGTCGAGCGCATAGATACATTCTTGGTGGAATCCTACTGC +ACTAATTACGAAATTTACAAGCTAGCTTACGAGGATATCAAGGTAAACGGTATCCAGCAG +GAAATCAAAAAGCCTGTACAGGCGCAGGGGAGTGGTGAGATTTTAGATGAAATGTCGCTT +GGCTTTAAAAAGAACCCAGCGGTTGCCACGATGAAAGATGCAACAACTACGCTGAATCAG +ATAGCTATGCAACTAGGTCTTACGCCGAAAGGCAGGGCAGAGTTGCTGACGATTGCCGAT +AGTAGCAAGCCTGAAAAATCGACTGCTGAAATGATGCAGGAATTTTTAAATAGTTAAGCT +TGGATTTAAAATCCAAGCTTTTATTTTGTGATAGAAGGAGGTGAAAGAGATAGATTTAGC +AAAAACTCACGATATTGTTGGTGCTTATGGAACATATAACTTTTTTGATATTCGTAACGA +ATACGCAGATCCAGGCACTCAATACGCTTTTGACGTTTTGGATGGTAAGAAACAGGCTGG +TTACATGATGCAACTTGCTTGCTTGCGACACTTACGAGACTTAAGACATCAAGGCAAACC +TGATTTTCCTTACACTTACGACTTAGCGGAAGCTGGCAAGGTGTTGAAGTTTGCCAAAGT +CTGTCCTAACGTGGATACTGGTGAGCCTACAGCGCTTATGGGTTGGCAAGAATTTTTGCT +TAGCCAATCTTTTGGCTGGCGCAATGAAACGGGTGGTAAACGCTTCTCGCAGGTCATTGT +TTCTGTTGGTCGTAGTCAAGGAAAAACGTACATACAAGCTATTTCTATGTGCTTTTCTTA +TCTCTTTGAAAGCCTCGGACTGTCTAACCAAGATTATCTAGTAAGTTCAATCAACTTCAA +ACAGACCATGAAGTTAATGGGCTATATCAAGAATATGCTTAAACAGATAATCACTAAAGA +ACCTTTTAAGTCTCTAGCTGAAGAGTTGGACTTGTCTATCCAGTCAGAACAAGTCATTAT +GAGAGCAAATAACAACGTTTTAAGGGCAATTTCGAGCGAAAGCGGTAACTATGATGGGTT +CCACTTCACTAATGCAATAATGGATGAGTCGGGTGATTTGAAAGACCGCACGAGCATTTC +TAAAATCGTTTCAGGGCAGGTTAAAATCCCGAACCGTCAATTTATCCAAATTTCCACTGC +TTACCCTAACCCGACTTCACCTTTAAGAAAAGATGAACGGATCATGCAGGGAATTATGGA +ATGCGATGACAGGTCGGGTGACACCCAGCTTTGTCTTGTTTGGTCGCAGGATAGCCCAGA +CGAGGTTTACAAGCCTGAAACATGGAGTAAGTCAAATCCCTTACTAGACCTTGAAAGTGA +ACATGATACGCTTCTAAAAGGTCTTATGGACAAACGAGATGCCGACCTTTTATCGGGGAA +TTTAAACGATTTTCTGATTAAAAACATGAATTTATGGGGCGAACAGGATGAAAATAGCTT +CTTGAAGCTGGAAGACATCGAGCGCTCGGTTATATCGGATTTTGACATCAAAGGTAGGCA +AGTTTATATAGGCGTTGACTACTCTATGTTTTCGGATAACACGGCTTTTGGCTTCGTCTA +TCCATATCAGGATGAAAATGGCAATCCTAAGTACCATTTGGAGCAACACAGCTTTATTCC +GTGGCAACAAGCAGGGTCAATTGAAGCTAAAGAGAAGATGGACGGCATCAACTACCGAGA +CTTGGCAGATAAAGGATTCTGCACTATCACAAGCCACCCGCAAGGGCTTATCAATGATGA +TGAGGTTTACCAGTGGTTGTGCGAGTATGTGGAAGATAACGAATTGCAAGTGCTTTTCTT +TGGCTATGATAGCATGGGTGTCTCTAAAGTTATTAAAGCTTTGGAACTTAACACCAGTTA +TCCATTAATGGCTATCAGACAGCGCACAAGCGAGCTGAAAGATCCAACCAAATTCTTGCA +GACACTTTTTATTGAGGGTAACTGTACACGGCTTGATGATGAAATCATGGAGAAGGCGCT +GGTTAATGCGGTTATCAAGGAGGATAATATTGGTATTCAAGTAGATAAGAAGATGTCTAC +ACTGAAGATTGACGTTGTGGATGCTCTGATAGATGCACTTTACCAAGCTATGTTTCATTT +TGAAGACTATGGACTAGCTCAAAACAACTCGTACATGGTGCAACATATGTCACAGCAAGC +GGTGCTTGATTGGTTTAACAACCCAGAAAGTGGGCTTTTGGAGGAAGAACTTTACGATTA +TGACGATTTTTAAACAACTTTTCAGCCTATTATGGGCTTTTTTTGATGTGATTATGTTTT +TAGCGGCAGCTATAACAATCAACGTGACGATGTATTTTGTAGGCTGGTTAGCGTTTGGTA +TCTGCTTAACAATTACATTCATTTTAGCCGGTTTAGCTAGTGAACTAATTTCTGGGAAGG +GAACTGAATAATATGTTATCAACGATTCTTAATATGGTGCTGATTGCGCTAGGTTTAACT +GCATTCTTATCGCTTCTCCTTTTGAGCGTTATCCTATTTATCATATCAGGCGTGGTAATT +TTCGGTGTCATTGACGCAATCGCAAAAAAAATAAAGTGCAAGTAGTAAAGTTCGTTTTTA +GAAAGGAGGTGAAACTAATTGCCTATATTTAATTTTTTAAATCAAGCAACGGAAAGCCCA +CCACGAGGCGACCCGAATGTTTTTTTTAGCGCAGATGACTACGAGTTTTTAAAAGCGAAC +CTGACTGGAAACGAGTGGGTTTCTGCTAAGACAGCTCTACGCAATTCGGATTTGTTTAGC +ATTATCAACCAGCTATCGTCTGACCTTGCGACGGTCAAGCTCACAGCGTCACGCAAAAAG +AACCAAGGCATTTTGGATAATCCAACGAACAATGCTAACCGGCATGGCTTCTGGCAGTCT +GTCTACGCCCAACTTTTGCTAGGCGGTGAGGCTTTTGCTTATCGCTGGCGCAATGAAAAT +GGCGCAGACGTCAAGTGGGAGTTTGTGAGACCGTCCCAAATCAGCTATAACGCCTTAGAT +ACCAAAGATGGCCTATATTATAACGTGACCTTTGAAGACCCTAGGAATGCTCCTAAATTG +CATGTCCCACAAGGGGACATCTTACATTTTAGGCTCTTATCCGTGGACGGTGGCAAGTCT +GGAGTTAGCCCACTCATGTCACTGGGCCGAGAGTTTGAAATCCAAAAGGCCAGCGACAAG +CTGACCCTAAACGCTTTGAAAAACTCTCTGAACGCTAATGGTGTCTTGAAAATCAAAAAT +GGTGGTTTGTTGGACTTTAAGACTAAAATGGCACGGTCAAGACAGGCACAACGTCAAATG +ACGGGCGGACCGTTGGTGCTAGATGACCTAGAGGATTTCCAACCGCTTGAAATCAAGTCA +AATGTGGCTAGTCTGCTTAGTCAGACAGACTGGACAACCAAACAGTTTGCTAAAGTCTAC +GGTCTCCCTGATAGTTATTTGGGTGGACAAGGCGACCAACAATCAAGTTTAGACATGATT +AGTGGTCAGTATGGCAAGGTGGTCAGTCGCTATCTACGTCCTGTAGTCAGCGAGTTAGTC +AATAAGCTAAGCACGGATATTGACACAGACCTGTTTCCAGCCATTGATCCACTCGGTACT +GGGTACATTTCGAGGGTTGTCAATTTGGCAAAGAGTGGTGTTATTGCGCAAAATCAAGGG +CTTTACATGTTGCAACAAGCTGAAATTTTACCGCAAGAGCTACCAGAGCCAAGTAATCCT +AATAATGTTGTTCGAACATTGAAAGGAGGTGAGGAAAATGGGAAAGATTGATATTAAAGG +CGACGTCGTTGATGACATGACCGCTGAATGGTACAGTTACTGGGGCATTGACTCGGTGTC +GCCAAAGGCTGTCCAATTGGCGATTGAAAACGATGAAGACGATAAAATCACGCTAGACAT +TGCATCAAGTGGCGGTGATGTCTTTGCAGCAAGCGAAATCTACACGCTTTTGCGAGCCTC +TGGAAAGCAAATTACAGCTAACGTCCAAGGCTTAGCAGCTAGTGCAGCTTCCGTGATAGC +CATGGCTGGAGATACTGTACGGATTAGTCCAACAGCTCAAATCATGATACACAAGGCGTC +TAATGGCAACATTGGCAACGCTGACAGCATGCGCAAGAATGCGGACACGCTAGATAGCAT +TGATAGTTCAATTGTCAACGCTTATGTTCTTAAAACAGGCATGAAAGACACGGATGTTTT +AAAACTTATGCAGGACGAAACGTGGATGAACGCCCAGACAGCAGTTGATAAAGGCTTTGC +GGATGAAATCATGTTTGTTAACGAAGACGATCCAGTCTTTACGAATTCGTTGCATACTAT +GCCGTCGAAAGAAAAACTCAATCAGTTCTTTAATATGCGCCTGAAAGAGAAACAGGCAGC +CATTGACAAACTGGAACACAAACCAAATAGCCAGTCTTCCAACTCATTAAGAGAACAGAA +GCTGGCTATTTTGCTAGACAAAAATTAAAAGGAGATGATTAAATGACAAAATCAGTAAAC +GAGCTTAACGCTCTATGGATTGAAGCAGGCCACAAAGTAGAAGACCTGAACGAACAAATC +AACACAGCACTGGCAGATGACAAGTTTTCTGCAGAAGCTTTCGCAGACCTCAAAGCACAA +CGTGACGATGCAAAGGCACGTCGTGACGCTCTTAAAGAGCAAATGGCAGAAGCGCAAGCA +CAAGCAATTATTGAAGACCCAACACCAGCTGCACCACTTACAGACAAAGAAGAAGCTACA +AAAGCGCAATTTGTTACAGACTTTAAAAATTTAGTTCGTGGTAATTACGCACAAATTAAA +AATATGGTTTCATCGGATGAATCTGACGGTGCAGGTCATGCTGGTTTGACTATTCCAAAA +GATATTCAGACCACAATCCACACTTTGGTTCGTCAATATGATTCTTTGCAAGGATACGTA +AACGTGGAATCTGTTTCAACAACCTCTGGTTCTCGTGTCTATGAAAAATGGTCTGATATT +ACAGCACTTGCTGAAATCGACGAAGAAGGCGCAAAAATCGGCGATAATGATGACCCACAA +TTAACAACCATCAAATATCTCATCAAGCGCTATGCTGGTATTTCTACAATCACTAATTCA +CTGTTGAAAGACACTGCTGAAAACATCATTGCGTGGTTATCTAATTGGATTGCTAAGAAA +GTGGTTGTTACTCGCAACACCAAAATTATCGCAGCTATCGACACATTGCCAACTAAACCA +ACGCTTGCTAAATGGGATGACATCATTGACCTTGAAGCAAAAGTTGACCCAGCCATCAAA +CCAACATCAATGTTCTTGACTAATACATCTGGTTTCACAGCGCTTAAAAAAGTCAAAGAT +GCAATGGGGAATTACTTGATGGAGCGCGATGTTAAATCGCCTACAGGTTACGTTATTGAC +GGCTTCCCTGTCAAAGAAGTTGGTGACCGTTGGTTGCCTAACAAAGCTAACGCACATCCG +CTTTACTTCGGTGATTTGAAGCAAGCAGTCACCTTGTTTGACCGCGAAAACATGTCGTTG +CTGGCTACAAACATTGGTGCTGGAGCGTTTGAAACAGACACTACTAAAATCCGTGTCATT +GACCGTTTCGATGTCCGTACAGTTGATAGTGAAGCCTTTGTCCCTGCAACATTTACAGCG +ATTGCAGACCAAAAGGCTAATTTGACAACTGGCACTGGAGTGTAAGCCTATGACGGTCAC +GGTTGAAGATATGCGCGTGATGCTCAATTTGGACGATGACGAGGGGGAAAAACTCTTGCT +CGTCTATATTGCATCAGCGACAAGTTTTGTTAAAAAAGCAATCAGCACAGAGGCGGACGA +CGCCTTTTTTGACCGTGACGATGTCGCACCGCTCTTTAAAACGGCGGTAATGGCTCGCAC +GGGCACACTATATACCTACCGTGTCGACACAGGCGACAGCTCAACTTATCCAATCGACGC +CACCACAAATAGCATTGTGGGACAGTTAAGAGGTGTATATGCAGTGTATGCAGAGGAGGA +GGCAAATGGCTAAAACCTTTTTACCATCCGAATTCAATAGGGTGGCAGATTTTGGGACGA +CAAAAACCGTGGAAAATCAGTATACGGGTATATCTATTCCAAAATTCGTGTCGCTTTTTA +AATTGCATTATAAACCTCATACTCGCACGCTTAATCAGCAATATCAAGCCACACAAGCGA +AGTTAGATGATACCAAGGTAATTATAGTAAGACACAATAAAAAGCTCACGGAGAGCCTGC +TAGTGACCATTGACGGTATACAGTACAGCATCGTGTCAATCAGTTCAGACGAAAGCTTTG +GATTGAACAAATATGACTATATCACCTTACGGAAAACTAAGAAGGTGGGCTGATTATGGC +TGATTTTCCTAGCGCATTGGAAGAGTGGGCTAAAACCGTGCAAAATATGGTAGAGCTTAC +GCCGAAAGAACAAGCTGAAATTACTAAAGCAGGGGCAGAAGAATTTAAGAAAAGGCTGGA +ATCTGAAACAAGACAGCGTCACTATTCATCACATAAAGATCCCGTTTATGGGCATATGGC +GGATGGATTAACCTTGCAAACTAAAAACGTTGATGGCGTCGTAGATGGCAAGTCAACTGT +AGGCTGGGAGAATGCTTTCCACGCCACAAACGCAAGACGTTTGAACGATGGCACAAAGAA +GTACAAAGCTGACCACTTTGTGACCAACGTGCAAAATTCGGCGGAAACCCAAGAAGCTGT +TCTTTTGGCAGAAAAAGCGGAATATGACCGCCTCATGAAGAAGAAAGGAGCTAGTTAATG +TCCGCAGTTATGGACGCAAAGAAAATTCTGCAATCGTCTGGACTAGAGCAGCTAGAGTTA +ATCTATGCTAGCAATATCCCGAAAGAAATGCAGGATAATACCGATAAGACAATCGCGCTC +ATCACGGACGTTGACATGCGCCTTGACCTTGATGGGAACGACACATTCCACGGAGCTGAA +AGAGAGGTAGAAATACAACTCTTCTATAAGCTCGATATTGATTTTGATCTAGATAGCTTT +GAATTTGCTTTGCTAAAGCTTTTTAGAAACAATCACTGGTCAATTGCAGACATTCGAGAG +CATACAGTAGACCCCGATACTTTACAAGTGACGTGGGTCTTTTATGTTGTCGAACATAAG +ATTTTAAATTAAGAAGGAGAAACTAATATATGGCAACAGTTGGTATTAAAATGGTTACGT +TAGCGCTAGTCGACGATAATCAGAAGCTTATCAAAGGGGAGGATGGTTTGTCAGCAAGCG +GCTTAGTGCAAATTGATGACAGCATGCTTGGGACGAAAACAGCTAACATTTCCAATCTAG +AGGGCTCTGTTACTAAAATCCCGGGTAACAACAAAATTCAAGAATCGTACACTAATCCAT +CAGCGCCGCAAGTCGCACTAGATTTTAATAATTTAGCTTTTGATATTAAGCAAAAAGCTA +AAGGTATGAAGTCAGACGGAAAAGGTGGATGGGTTTATAGCGGTAAAAAGCCCCGCGTGG +CAATGTTGCTTGAGTCCGAAACGCTCGACCGCAAACACTCTATCTATACAGGATTTGGTG +ATGGCATCATGCAAGAAACGACCGCCAATCACGGAACCGACACAGACACAGCACAAACCC +GTGCAAATGACATTTTGACTTATATCGCAAACTCAACGGTGGCGTTTAATAATCAACCTT +ATAAAGTTTATTTCAGCGGAGATGAACACTTTGATAAAGCTAACATGCTCAAGGAAGTTT +TCGGTGGCTATGCAACTAGCGTGGCAGAACATCAATAATTTTTAAGGTTGCATTTTAAAT +GCGACCTTTTTGTTTTATGTAAGGAGAAATCATGGAAGTTAAAACAATTAAAATCCCAGA +AATTGCTAAGAAGCCTTTCCAATTGCTGACAACAAACCGCAACATCATGCGTATGCAACA +GTACCAACTCGCTGTTTTAAAAGTTGGAGAAGACGTTGGCGAAGAAGACGTTGCTGGTCA +AACTCAAGCTAGTTTAGCAGTTTTGGAAGAAATGCTAAGCTTTATCCGCGTCATCCTCAA +TCTGGACGATGAAGCCTATGAAAAGCTTTTGGATATGCCTAACGACCGCACACAGGAAGT +GGTTAATAAACTTGTGGGTTATCTCTATGGTTTGTCAGACGAAGACATGGCAGAAGCGGA +CGTAGAAAACCCAAAGGAAGAAGCTTAGGCGAACAAATTTTTGAGCTTGAAAATAAAATT +GAAGACATGAAACTGATAGCCAAACAGGCCCTATCAGCATACGGCTGGACGTTGGAAGAA +TACTACGAAACAGACTTTTACGACCTCATGAACATTTTGGGAGCGAAAGAAGTCAAGGAT +AGACCAGTAGACCCGATGTCTTTGCTGAAATAAATGGATTTCAAATCCAAAAAATATCTC +GGAAAGGAGGAAAAAATGGATAAAAAAGTGCAAGCGACCATGTCGACCGAGATTGCTCTT +GACCTCGTGAAAGCAAGCGAGAGCATTAAGAGCATGACTCAACTGGTTAAAAGCTCTACT +CAAGCATGGAAAGCGCAAGAAGCACAGCTTAAAAGCGCAGGAGATAGCTTAGGTGCTGCT +AAGGCTAAATATGATGGTTTAGGTGCATCAATCCAAGCCCAAGAAAGCAAGATTGAAGCC +TTAAAACGCAAGCAATCTGAGTTAAAAGGGGATACGCAACAAACCGCTGAACAGTATCTT +AAGTATCAGCAACAGATTGACCAAGCGACTGCAAAGTTAGCTAGCATGGAAGCCCAGCAA +TCCAAGGCTAAGCAGTCTATGGAATACTATTCAAGCGGTTTGGCAGGCTTGCAGACAGAC +TACAAGAAGATGAACGAGCTGTCAGATAGTTATGTGAAACGGCTTGAAGCCGAGGGTAAC +AAACGACAAGCAGCGCAAGAAAAAGCTAAAAATCTCAAAGAAGCTACCAAAAATCTAAGT +AAGCAATACAAATCGCAAGTTGACGAGCTTGAGAAAATCAAAAACAAAGTAGGCGCAACT +AGCGAAGCTTACCACAAGCAAAAGATAAGGGTTAACGAGACGGCTGCGGCTTTAGCAAGT +TCAAAAGCCAAGATGAAAGATGCCCGCGAAGAAATGGAGAGGCTCAATCCGACTATTTGG +ACTCGCATGCGGGATTCTGTCAAGAAGTTTAACAATGAAGCGCAGAAAACAAATAAAATC +GGTAGTCATGTTAAAGACTTTGTAACTGGAAATCTGATTGCAAATGGTATTACCAACATC +ACTTCAAAAGTGGTCGGATTAGCTAAAGAGGGCTATGCCGCAGCAGAAGCAGCGTCCAAG +ACCGCCGAACGTTGGCAGAATTTGGGATTTGCAGAAGAAGAAATCAAGAGGATCAACTCT +ACTGTTAAAGACTTAAAATACAATACGAACCTTTCTGGTGGTGCAGTTGGTGATCTGATT +CTGAAATTTCACGGAATTACTCACAATGTAGATGAAGCAGCGGAACTTGCGAAAGGGGTT +GGTAGTCTATCTGACCAGCTTAAACTCTCACAAGAGAGAGCAGAAGCATTTGCTGGCGGA +TTAGGCAAGATTGAAGCGTCAGGAACAGTCACAGCTACATCTTTAAACAAGCTAGAGAAA +CAAGCGCCTGGATTAGTCCAAGCGTTACAAAAAGCGTCTGGATTGTCAGAAAAAGCATTT +TCAGACTTGCTTAACTCTGGCAAGATGACCTCTAAACAATTTAATGACATCTTAAAGTCT +GCGGGCAAAAGCTACGAAGAGAACGCCAAAAAATACGGCAATACAGCTGAGGGTGCAAAG +AAAAGAATCACGTTAGCGTGGGCGGACACTAAAAAAGCCCTTATGAAGCCCCTTGTAAAC +GTTGCTTCAACCGGTTTTAACCAATTAGCAAATGTCTTGCAGAATCCTGCTATCCAAAGC +GGAGTAACAAAAATCGGTGAGGGTATTAGCAAGATTGCGCAACACGCTACGAACCTTTTA +AATTACATAGCAGCACATCAGAAAGATGTATCTTCTATCGTTGGTAATTTGGTAGAAATC +ACGAAGTTATTCGCATTAGGCGTTTGGGAAGGCTTTAAAGCTACTGTCACTACTATAGCT +GATGTCTTTAATGATTTAAGCGGTCATAGTGCCAAGGCTAAAGACCCGCTAAAAAGCGTA +TCTACTTTTTTAAAAGAGGTCGGTAAACACAAAAAAGCAATTGTCGCAGTTGGCAAAGCT +TTTGCTTTTTACTTTATCGGGTCAAAGACAATAAAAGGGATTGCGTCTCTTAGTGCTAAT +GTTTTAAAATTTGGCAATACATTTGTGTCAACAATGAAAATGGTAGGAGCTGCAGCCGCC +ACAAACCCTGTCGGGGCTATATTAATAGGTGTTACTGCTTTAGTAGCAGGATTTACTTTG +CTTTATAAGCACAACAAAAAGTTTAGAGATTTTTGTAACGGGATAGCAAGTGGTGCTAAA +AAAGCATTTGACGACGTTGTTAAATTTGCAAAACATGCTTGGGACGCAACAACAAAAGCC +TTTAAAGGCATTGTCAACTTTTTTAAAAAGGACTGGAAAGAGCTATTGCTTTTTATTGCT +AATCCTATTGTCGGTGGTTTTGCGCTTATTTATAAGCACAATGCTAAATTTCGCAAGTTT +GTGAATGACTTGCTCAAAAAAGCTTCAGACTTCGCCAAAGGTTTAGGTAAGTGGTTTGGG +GATGCCTTTAAAAATGCTAAGAAAACCGTTGATAACGGCATCAAGGCTATAACAAAAGTC +TTTAAAGCTGGTATTGATTTCTTCCGCAAAGACTGGAAGGAAGTCCTGCTTTTCATTGCC +AATCCTATTGTCGGTGGTTTTGCGCTTGTTTATAAGCACAACAAGAAGTTCAAAGACTTT +GTTGACAATATTTGGGAAACGGCCAAAGATTTCGGCAAGAACATGGTTGATGGTGCTAAG +AAGAAAGTTGATGAGTTTACCAAACCAATCAGAACGGGACTTGACAATTTACATGACAAG +TTTACGGATATTTTCGACAAAATCAAAAGCGGTTTTACGGATTTCTGGAACGGTCTCAAA +AACCTAGCTGGCGACGGTATCAATGCAATTATCAAAATCCCAAATGATGGTATTGATGGT +ATCAATGGTCTGATTGCCGATTTTGGTGGTTCAAAGAACGCCATCGCTAAAATCCCTAAA +GTCAAGTTTGCCGAAGGGACGGGAGCTTTTAGCGGATACCGCAATGCCATCACACGCCCG +ACGCTTGCCACCCTAAACGATGGTAATGACAGCCCTCATACAAACAATCAAGAGTTGGTT +ATCATGCCAAATGGTCAAGCGTTTATGCCCCAAGGACGTAACGCTCAGATGATTTTGCCA +GCAGGCGCTGAGGTGTTAAATGCCCGTGAGACAGCTATGCTTCTAGGGTTATCGCAAGGC +GCTTATGCCAAAGGTACAGGCTTCTGGTCTAAAGTTTGGAATACCGTGACGGATGTTGCA +GGCAATGCATGGGACGGTATCAAGGATACTGTCTCTAAGTTCACTAAAATGTTGGAATTT +ATTGGTAGTGCTGTAACCGACCCAGTCGGAACACTGGCTAAAAAGTTCAACCCAAAATCT +GACAAACTAGATGGCATGTTTAATCCTTTAGGTAGCGCCTTGTTCAAGACGCCAATCAAA +GAAGCCCAAAATTGGTGGAAAGAGCTTTGGTCAATGGCTAAAAGCGCATCTGATGAAGCG +TCGACGGTTGCTATGGGAGCTATGGGAGACGACTACCCAGCTCATTTGAAAGCTGGCGCT +GTCTGGTCGAGTACTGACCCATGGGGCTATTTCGTCAAGGAGTGTGTCTCTTTCGTTGCT +TCTCGTCTTAATAACTTAGGGGTTAATCCTGCTCTATTTAGCCACCTCGGCAATGGTAAT +CAGTGGGGCAGTGCACGAGTGCCACATTTAAACAGACCTAAACCTGGTACAGTTGCTGTT +TATACTGGCGGACCTGTATCAAGTAATCACGTTAGTTTTGTGACGTCTGTAGATGGTGAT +ACATTTTCAGGGGAAGAGTATAACTGGATGGGCAATCACGCCTACCACCAATACTCAAAC +AGACCAATCTCAAGCGCATCTACATTCCTTGATTTTGGAGTGCGAGCACCAGGAACAAGC +GGTGATGGTGATAAGGCTTTATCAGAAGCTAACTCACCATTACAAAAACTGATTAAGTCG +CAGGTCGGAGGCATGTTCGACTGGATTAAGAAGTTTCTAGGTTTTGAGAGTGGGACGGCT +TCTGGACCTAACCCTCAAGGTACTGGTGTGGCACGTTGGCGAGATACTGTTATCAGAGCG +CTTAAAGCGAATGGTTTGCCAGCCACCGACCACCAAGTATCAAGTATGTTGCAGCTTATC +CAACGTGAGTCAAATGGTGATCCAAACGTGAAAAACGGTTGGGACATCAACGCTCAAATG +GGCAATCCATCTATTGGGCTTACTCAGACGACTATCGGCACATTCAATGCTAATGCTTTT +CCAGGACATAAGGACATTCGTAATGGGTATGACAACCTGCTAGCGTCAATCCATTACATT +CTTGGGCGCTATGGTTCTTCGGATGCAGCCTTTACACGAGTTGCGAAATACGCCTATGCT +AACGGTGGACTGGTGTCTCAACACGGCGTATATGAGCTAGCAGAGGGTAACATGCCAGAA +TATGTTATCCCAACGGATATTGCCAAACGGGGTAGAGCGTGGTCGTTGCTTGCGGAAGTT +GTTGGCAAATTTGCAGGTCAAGCACCACAAGAAACCAGTGGGCATAGCGATGACAGCGCA +TTGAAGCGCCTCGAAGCTAAGTTTGACACAGTCATTGGATTGTTGACTCAATTGGTTGCA +AATGGCACAAATCCTATCGTGCTTAGAAATATCATTGATGGGCAAAGTCTAGCAAACGGT +CTCGCGCCTTATGCTAGCACGGCTCAAAGCAATTATAATAGCCGTATGGCTAAATTGAGA +GGTGAGATTATTTGGGAATAAACATGAGTTTCGGTGGTGTTGACATCACCGAAGAATTAG +AAAGGTTGGGTGGACTAGCGGATGTAACGAGCGCCTCGCGTAATATAGCTAGCAACGTCA +ATAATACCTACCAAGAACAAGGCTCTAGGCGCTATGGCCAAACCCTCTTTTATAGCACAT +TATCCGTTAAGGCTATCACAGTAACTATCAAGTTAACTGGTATGTATGACTTTTTTAATG +CTGTCCAAGAAAAATTGGGTGGCATTTTAAATGCTCTTGATGAGAAAGAGCTTATCTTTG +GGGATGAGCCTAACAAGGTTTGGATGGCAACATGGAGCGGTCAACAGACTGTAACTGTTG +ATGACTCAACCTCCCCACCAACAGCAACAGTCACGTTAAACTTTGATGTCCCAAACACCT +ATGCGGAAAGCAAGACAAGCGCTAGTATAAGCACCAGAGGCGCTAATAAGTTTGGTTCTA +TTGTTAAGCGACCAGACGGCAGCTTCAAGGCTACAATTAACAACTTTGGCACGGCCGAAA +CACAGCCGACAATCACTATTAAACATAATAGCGAGAATGGATATATTGGTCTTGTGAATG +CTAGCGGTGCGAAAGCAGTTGGAAATGAGGAAGAAGCGGACAGCAAGCCTGCCAAAAAAT +CTGAAATCCTGTTTGACTACGTGTCTAACAACTGGATAACGAAAGGTCTGTCAGATGGAT +TGAAAAACGTTGCAGTCCTAAATGATAATAGTTGGGTAAAAGATGGAACACTGTATATTG +ACAACGCTTGGGGACGTCCTCACATCGCTTTAACTGGAGACTCTCGTAAGTCTGGTATGC +ACTCTGGCACGTTGACTTGGGACATTCCAGCAGACAGCCAAGGACAAAAAGGAGCAGTCT +ATGAGTATTTTTGGTGGCGTCAAATCTTTTGGCTTGGTTCTGCGACGCAATGTGGCTCCA +TCCAAGTTACTGTAACGGACGCAGACGGCAATTTTCTATACGGGGCTGAAACTATCAAAC +GTCGTGCTGGAACATTGACAACAGAATATAACATTTTGGTTACTGACGGTAAAGGTGGCT +ATAGGATACTGGAGTCCTACACATTTTGGGGAACTCACTTAGATAGTCAAAACCCCTTTA +ATGCAGAGCGTGGATGGTCCGACTTGCTAAGGTCTGACGACCAGCTACGGATTTTCTGGT +GGGGGTCATATCCAACACGAACAGTGCCAGAACTTAAAGGTAAAAGGTCTGCTAAGCTCA +ATGTTACTTTTAATGTTTGGGGCGACCACCCAGCAGTTACCCACATGTATTTAGATAGCA +TTGTTTATCGTAAAGACTATGTCGAGTACCAAGAAGACATCCCTAACCTCTTTAGACCAG +GGTCAACCGTTGTTTTCGACATGGCCAAGGATAAAACCTATATCGACAACTTAAAAGCAA +GCGACAAGGAAGCCGATGGGGCGGTACCGCTAACTATACCAACTGGCACAAGCGAACTGG +ACTTGTACTTTTCGAGCTGGATTGGAAAAGACCCTGAAATCACCATCGAATGGAAAGAGA +GGTATATTTAATGCAAATTACAGTTTGCGATAAAAATTTAAAAAAGCTAACCGCTTTAAA +TAACGATTTCCCACAAATGCTCTCTTTCTCTGCGGATACTTGGCATAGATACCGCGAGGA +TGGTGTTTCGACCTTTGACTTGACTGTCTCTAAATTCAGAGGTGGTAAATTGCACGAGGA +TATAGGTCTTATCACTGATGATGTATACCTTAAATTTAATTTTGATGGTGATACTCATAT +CTTTGCTATCACAAATATTGATGAGGATGATTTTAGTCTCAAAATCACCTCAAACAGCAC +GCTCTTGGAATTTACCAACGAGCTGGCCAATCCTTTTGAAAGCACTAGCGCTCAAACTAT +TGCATGGTACATGGAAAAGATGGAATTGCTAGGCTTTGCTGGTGCAGAAATTGGGTTGAA +CGAAATCTCTGGCAATAAGCGCACACTGAAATTCGACTCGCAAGAAACTAAGTTAGCACG +TCTAAAGTCCCTCATCTCTCAATTCGATGCGGAGTTTGAGATAAAGACGCAGGTTAATAA +AAGTGGCTCATTTAAACGCTACGTCATCAATATCTACCACGAAGCGGACGACAGCCATCA +CGGCATCGGAAAAGTTCGTGGAGATGTCACCCTTCGCTATGGCCGTGACGTCAAAGGTGT +CCAACGCACTGTAGATAAGACGGAGTTGTTTAATATGGGTATCTTTACTGGTGCTAACAG +CTTGAATATGGGTGATTATGTACGCTCTGACAAAGACGAAAACGGCGAGGAAGAATTCTA +CACACGCAAGGGCAATATAGCTGTATACGCTCCAAAATCAGCCAGAATGTACCCTGCTAC +GCTAAGGGATGGCGATAATTGGACTAGGAAGGATTTTCAGACAGAGTATACCAATCTTAA +CGATTTGGCAGCCTATGCTTTTAAAACACTGAAGGCATACGCATATCCTTTAGTGACCTA +TACAGTATCTATCCAATCTAATTTCTTGGCAAATTATGGCGATTTGGCACTAGGTGACAC +GGTTAAAATTTACGATGATAATTTTAACGGCGGATTGATTCTGACAGCACGCATCAGCGA +ACAGATTATCAGTTTTAGCAATCCTAACAACAACAGCCTAGTCTTTAGCAATTACAAAAA +GCTGAAATCTCAAATTTCACCTACTTTGCAAACTCGAATGAAAGAGATAGTAGAAGCCTC +AATTCCCTACACTATCAAGGTTGCTACCGACAACGGTGTCGGTTTCAAAAACGGTCAAGG +TCAGTCCGTGGTTACTCCAACCCTCACGAAAGGTAACAAAGTCATCTCCAGTGGCTGGCG +CTGGGTCATCGATGGTGTTATCAAATCCACTAGCCCTAGCTATATTGTTAAGGCCGCTGA +CATCAACCAGACAATGGTTTTGACAATAGCGGCATGGGTCGATAACAAAGAGGTAGCCTC +TGAACAGATTACCTTTATCAATGCTGTTGATGGCGTGGCAGGAGCGAAAGGCGATAAGGG +GGATGTGGGTCCTCGTGGACCACAGGGCGAACGTGGCTTACAAGGTATTCAAGGACTCCA +AGGCCCTAAAGGTGACCAAGGTATTGCTGGCGAAAAAGGGGCTGACGGCCGTTCACAGTA +CACTCACTTAGCATACGCTGATACTATTTCAGGAAGCGGTTTTAGTCAGACTGACCAAAA +TAAGGCCTTTATTGGGATGTATCAAGACTTTACGGTTACAGACTCAAAGAATCCAGCTGA +CTATCGCTGGAGCAAGTGGAAAGGATCGGATGGTGCAAACGGTATACCAGGTAAGCCTGG +AGCTGATGGAAGGACGCCTTATATTCATTTTGCTTACTCTGACAATGCAGACGGTACAGG +CCTGACAGTAACTGATAATGGTCAACGCTACCAAGGTTATTATTCGGACTATACGCAAGC +TGATAGCACAGATAAGGCCAATTATAAATGGATTGACCGCTGGGCTAAAATTGAGGTTGG +GGGTAGAAACTTAGCTCAAAAAACTAGCAAAGAATGGTCACTCCCTTATACAGATTTTAA +AGGCATAGCAAATACTTGTCCTGATTTGTACAAGATACTAATTGATGGTTTAGCGGTTGG +TGATACGCTTAAATCACGCATTGTACTCAAATACACTGACGTTGTCCCTGCTAGTGGGCA +AACAGCTTCTGTATGGTTACAAGGGAGTGGTGATGTTACCGTTTGGAATGCTGGACGGTA +TAACGATAGTTCGCGAAAAATAATTAGTGGAAGTGGCGAAGTTGTTTTTGAACATGAATT +TAAGATTACTGCTGATCATTTGAAAAATAAGTGCTGGTACTGGCAATTCAGAACGGATTA +TATTGCTAGTGGTTTGTTGCAATGGAAACTTGCTAAAGTTGAGTCTGGAACTGTTTTTAC +AAATTGGTCACCGGCTCTCGAAGACGTTCGGGCTGATATTGATTCCAAAGCTGACCAAGT +TCTAACTCAAGAGCAACTCAACGCTCTCAATGAGAAAGCTGGGGTTATCCAAGCCGAGTT +AGAGGCAAAAGCTAGTATGGACACGGTTTCTAAGTGGTTTGTTGATTTTCAAAAGTTCGT +CAAAGAAGACGCCGCAGGAAAATCACAGTCAGAAAAAGATCTACTAACCCTTACCCAAAG +AATAGAAGTAATGAATTCGGAATTTGGCGACAAGGTTGCACAGTGGTCCTTTTTGGATGA +CTATATGCGCGCAGGCAACAAGGGTCTGGTAATTGGCAAAAAGGATGGTTCGTCATCTGT +CCGTGTGTCAGACAATCGGATTTCGTTTTACTCTGCTGGGAAGGAAGTTGCTTACATTTC +TGGTGGTGTTTTACGAATTGACAACGGGGTATTTACCAAAACGTTGCAAATTGGACGTTT +TAGGGAAGAACAGTACCACATTAATCCAGATATGAATGTAATCAGATATGTAGGAGGCAA +CTAATGGCTGAATTTTGGTCAAATAATGATAGAGGATACCGCATCCGTTTATGGGTTGAC +CAAGTATCTCAAAATACACAGGACAACAGCAGTCAAGTAAGGGTACGGCTGGCATTGCTT +AATACTACGACAACTTTTGCGCAGTATAGCTGTAGTGCTTATGTTGACCTTAACGGTCAA +CGTTTAAATTGGTCTGGTAGCCCTTCGATGTTGGGGTACAATCATACTATCATGCTCATT +GACCAAACTATTACAGTTGGTCATAATGCAGACGGAACTAAGACCTTTGGCTTGATGGCT +AGCTTTAGTGGTGGCGGTGGATGGTCACCCGGCAATCTAACCATTGGTGGCAACTCATTC +ACGCTTACCACTATTCCGCGCTCCAGCTCTGCTAGTGTAGTTGCTGGCGTTATCGGTAGC +GCAGTTACTATCAACATCAACCGTCAAAGCTTCAGCTTTAAGCATACGGTCCGTTATGCT +TGGGGCAATAAATCTGGAACTATCGCTAGTAATGTAGATACAAGCGTTACATGGACGATC +CCTCTTGATTTTGCTAACGACATTCCCAACTCATCAACGGGTACAGGCACTATTTATGTT +GATACTTACTCAGGAAGTACACTGACAGGGACGCAGTCTGTTACATTTACTGCAACAGTC +CCGGACACAATGAGGCCTACATTGTCCAGCGTCACGTTGTCAGATGCTAACACGATTGCT +CAAAATTTAATCCCTAACTCTGACACGTTCATCCAAGTCTTATCAAATATTAAGGTGGCA +TTCGATGGGGCAAGTGGATCGTACGGATCAACCATCACTGGGTACCGTGCTGAAATCGTT +GGTAAAAACCAAGCTACAAATATCAACGGTGGGACTCTAGGTATCATGAATTACAGTGGG +GATGTCACTGTCAGAGCTAGCGTAGTTGATAGCCGTGGCCGTTGGTCGGAAGCGAAAAAT +ATCCAGGTAAAGGTGCTTGAATACTTCGCCCCCGCTTTAAGTTTTAGCATCGCACGAACA +GGTTCAACGTCTAGTACGTTAACTGTGACTAGAAATGCCAAGATAGCACCTCTGCCAGTC +AATGGGACCCAAAAAAACACCATGACCCTCACATTCAAGGTTGCTAGACTCGGCACAGAG +TCATACAGTCCAGACAATGGGTCAGCAAGTGGAACATGGTCAAGTATAAGCACACTAATC +AACTCTCAAGCTAACCTTGCAGGCAATTATCTAGCTAATCAGTCGTGGGTTGTCATTGGG +ACGCTTGCTGATAAATTTACTCAGACAGAGTTTGCTGTCAATGTAGCCACGGAAAGCGTG +GTCTTCTCTTATGACCGTTCTGGTGTTGGAGTTAACAAAATCCGTGAGCGTGGAGCACTT +GATGTAAAAGGTGATATTTATGCTGATGATAAACCTATACAACAGTACCAACTTACTAAT +AATAGTGGTGGCTTGAATAATGGTGGATGGAATCAACCATGGAACATTCAAAAGACTTCG +TTCGATTGGCGAAATGGCAACTTTGCCGACCACCCTCTAGGCAAAAATGGCCCGTGGGGG +CTATTTCAAAATTACTGGCTTGATACTTGGAAGGGTGCTCAATTCTTCACAGAGTTCGGC +AATGGTCGTCATTTCATGAGGTATTATAATAATGCTCGAGAATGGAAACCTTCGCCATGG +AAGGAATTTGCTTTTACTGATCATCAAAACCTCATCAATACAGGATGGGAACCTGCTGGC +TTTGAGGGGACATACTATAAGCGCGTGGGGGATGTGTTAACTATCAAATATGACTTCGTT +GGGAACGGCTCAGATATGAATATAGGTACTATTCCTAGCGAAATTTGGGTAGCACCCCAA +TCTTACATGTTACTCATAGCAAAGTGGTCTATTGGTGGCTCCGACAATAGTCATGTTCAA +ATAAATAAAGGCACAAGCGCCTTGAATGTACTATCAACAGGTAAGGGAACAATCTACCAA +GGTCAACTAACCATCATGATTTAGAAAGGAAATACCATGAAATTTGAATACGGCTCAAAA +TCACAAGAATATGACACAAGTGGTTCAGCGAGCACTACCAAAGTCACCCTAGTAAATGCT +GAGGGAGCTACTATCCCTGTGCATCTTCCAGCTGATAAGATCGATTTAAATAATACAGAA +CTACTTGAGTTAGCCTTAGAAGTCATCTATCAAGAAAACTTTCCAAACCGAGCAGAAAAT +GAGAAATTTGACAAGGTGGATGAGCAACTACAAAAAAACAAAGAGCTTGCAGGCAAAGCT +GAGCAGGTTGCGACTGAGAATAAGGAATATCTTGATACTGTTTCAGCGATAACTGAAGTA +TTGATTGCTCTTGCTATCTCGCAAAATGGGGGCATGCCAACTCCAACCTACAACAAGGTG +GCTCAGTTTATCAAACCTTTAACCAAGAGCGCACGATATGTCAACGGCGACATCGTATCT +ATGCCTTATCCGTTTGATACCAACAGTAAGTGGCCAAGAGGGACAGCAACCATCTTCAAA +TTCCAGATGCAACAATCAGAGGGCTATACCTATAAGGAGCAAGCGTTGTCTGACATATTA +CAACAAGGCGTACTCACTGTAGTTATGCCACGGATCGACTAAAAGGAGGGACTATGACAT +GGCTTGATGTATTTGAGAGAATAATACACGGAACATCTCAACTAGGACCTACAATCGGGC +TCATCGTATCTAGCTGGTTTGGATTGCTTGCTGGCAGGTCTGGCAATCTCAATAAACAAC +AGTTTAAGGAGTTAAAGGACGAACTTGGAACAATCCAGCTCTCTGTGGATGATGTACGAG +AGGTCGGAGAAGATAATAACAAGAAGATAATTGAAGTTAACGAAAAGTTAATTGTACACG +ATGAGGCTCATATAGTGACAATGTATCTACGTTTAGAGCGTGATATGACTGCGGCAATCA +ATCGAGGGTACACTACTGTGCATGAGTCCGACATCGTGTATAGAATGCATGATAACTACA +AAAAACTTGGAGGTAATGGGCGTATAGATAGCCTATTTGCCAAGTACAACCACTTAGAAG +TGAGGAATTAAATTATGAAAATCAACTGGAAACTACGTTTTAAGAACAAAGCAACTCTAT +CAGCTATTGTAGCTACTATCATCTTGCTCGCCCAACAACTGGGCTTAAAATTACCTGACA +ATATTTCTGAGGTTGTCAATACAGCTCTAACCTTGCTTGTTTTGCTTGGGGTTGTGTCTG +ATCCAACAACTCAAGGATTGTCTGATAGTGATAATGCTTTGAATTACCACCAACCTCGTG +AGGACTAGCATAAAAGCCATACAATTATTGACAAAAACAGCATTTTGTCAATAAAACAAG +AAGAAAGGAGAATCATGACAACTAAAGCACAATTATTAAGCACCCTTGATAGCTTAGTTA +ATCAGCGTGTGACAGTGCCAACCAACCCATACGGTGGACAATGTGTAGCCTTGATTGATA +ATGTTTTGCAATATCAAGGACTGTTTAGCCTTGATTTTAGCTATTTGAATGCTATTGACG +GGCTAGAACGTGCTGCAAGTCTAGGATTGAAAGTAACACCATTTAACGGTTCTAACAATC +CGCCAGTGGGTTCTGTCTGTGTAACTAACTGCTTGCCATATCATCAGTTTGGTCATATCT +TGTTTGTAGTGTCGGAAAACCCAGACGGTACCGTTACCACAATCGAACAGAATATCGATG +GTAATGCCGATGCTTTATACAATGGCGGTTGGACTCGCAAAGTCACTAGAAACCTTGACA +GCGCAGGGAATTTCAGTTATATCGATTGGAATGCGCCAACACAGCAAATGGTCGGATGGT +TTGAATTGCCATTCGATAATTCTGAAATCGAACAGGGTGGCCTTGGTAAAGGTGATTACT +TCATCGATGTATCAGCATATCAAGCAGGAGATTTGACTGGAATCTGTCAGGCATCAGGCA +CTAATAACACTATCATCAAGGCTACTGAGGGCATCGGCTGGATTAGTCCAGTAGCTACTC +AACAAACTAACACAAGTAACTGCATCGGTTATTACCACTTCGCCCGTTTCGGTGGAGATG +TGGCAACAGCACAAGCTGAAGCCAACCATTTCATCAGTAATCTGCCATCACGCCCTCGTT +ATTTGGTATGCGACTATGAGGATGGCGCTAGTGGCGATAAACAAGCGAATACTAATGCAG +TGTTAGCGTTCATGGATGTTTGTAAGGTAAACGGGTTCGAGCCAATATACTACAGCTACA +AGCCTTATACGTTAGCAAATGTATACGTTGAGCAAATCACCGCTAGATACCCTAACAGCC +TATGGATAGCAGCATACCCAGATTACGAGGTACGCCCTGAACCATACTGGGGTGTATATC +CAAACATGGAGCATACTTGTTGGTGGCAATTCACTAGCACGGGCTTATCTGGTGGGTTGG +ATAAAAACGTTGTAATTATTGGAAGTGAAACGAAGAAAAAAGAAGAAGAGGAAGAAGATA +TGAATTTTGTAGTACGTAGCACATCTGGAAACCAAGGATACGTTGGAATTGTTAACGGCC +GTGTGTTTGGAATTGGCGACATGGGAACAGTCGATGAATTGCGTTCAAACGGTGCTAAAC +ACTTAACACTCAATGATGATGATTTCACACGTTTCCTTGATAGCCAGTCACGAGATTCTG +CCGAAGTGTCAAAAGCTATCGGAGAAGCTAGTGCATCAGTCGTTAAGGCTATTGAAGAAC +GTGGGAACGCTACGCAAGGACAAACTGGGAAATAAAAAACATAGACCACGAAGAAAAAAT +TAAATAGAAAGAAGGCAAATCACCTCCCCTCAGACTGCAACAGGGATATCATGGCAGTGG +TGGTCGAGCCTCAGCATTGCGCTGGGGCTTTTTTTATTTTGCAAAAAAACCACTCTAGGA +AACTAGGGCGGTTTTTGATATTTTAGAAATCTTTTGTGAATAGGTGGTCATCACCCGTCA +AACACCCGTTTTTTGAAAATTTTCTGTCTGTCTTTATCTTATTCTAAAAAACAAATTCCC +TATAAAATAAGGTTTTTATAGGGATAAAACAAGAATAAAAACGCCCTGAAATCCCCTCCT +CTCCTTTTATCCCATTGATATATCAAGGGTTTTGGGCACTTCCCCCGTTTTTCACCCGTC +AAATTTCAAGGTTTTGAAAAATCTCTTTGACTTTGTGGTCGTTTTTTTCTTTTAAGCTTT +CAATTTGGTGGGCATAAGTTTTGAGTGTAATGTTTAAATTTTCGTGTCCCAAAAGTTTTG +ATACGGATATTAAATCCACCCCTTTATAAATCAAATAAGAGGCGTACGTGTGCCTTAAGG +AGTGATTGGTGTAGCTTTTACCAGTCACTCTTTTTATAACTTTATTAGTGGCGTTATTAG +ATGCTCCATAGCATATACGCCCTAAGTCGTTATCTCGGTAATGATTGTCCCGATAAAGTT +TTAAAACCTCAAGGCTGTTTTGGTCAATAGGCACTACTCTGATTGATTGTTCATTCTTTG +TAGCTCCAAAATCTTGCGATATGGAATAGTCAAAAGATTTATTGACATCTATGTAGCCAT +TTTTGAAATCGACATCATTCCATGTCAACCCTTGCGCTTCGGCAAAACGTAAACCAGTTA +CGCCAATCAGAAACGTGGTGAAATAAGATGGATGCTTAATCTTTTGCTTGGCTATTTGCA +GATAGTGCAAGTATTCATCCTCTTCCATGAACTTTTCAGATTCTTGCTTGCCAGACTTTT +GCGCCTTGACGATAGCACCCTCAGCAAAATTGTCACGAATGATCCCGTCACGAATAGCCA +TTTTGCAAGCGCCTTTGATTTGATAATGGAATTTTTCGAGAGTTGATTGCGCAACGTTTT +CGGCAAATTCGTTTAATATTTGTTGATAGAACGTGTGCGTGATACTTTTAAGTTTACGCT +CACCAAAAAGTCGTTCAATGTGTCTGAAATTCTTCTCGTAAGTTTTCCAAGTTTTAGGGG +TAACATGCGGTCTCTTGTATATATCTGCCCAGCGTTTGTTGTAATCGAGTACTGTGATGT +CTAGCAATGCGTCTGAGACAGTGCTGAGCTCTAATTCAACTTGTTGCGCTGCCACTTTGG +CTAGTGTCTTGGTCTTGAAACCACGTTTTGACTTTTCACGTTTCTTGCCATGACTGTCTC +TATATGTGATACGATATTCCCAGCCTGAATCCAATTTTCTAAAAAATGCCATTGTCAAAA +ACCTCATTTCTTGATAAAATGAGTACAGTAAAAAGGGCTTTTTAATGCCGTTTACTATAC +ATGGTTGCCTCACGCTCAGACTCGCCAAAGTTTGAGAGCGTGGGGATTTTTGTTGACTAT +AATAAGGAAATGGTATAGAATAGAGAGTGAAGAAAGTGTCTTTTTCTAAAATTAGTTTAG +AACCTGCCCTTCTCCTAGCAAATCCCCGCTAGTCCCGACGATAGTTTTCTGCATCTCGAG +CAGTCCTCTATCGTTTTTTTGTTATATTAAATTTCCATTGCTAATTAAATCATAAGCCAA +TAATAATCGTCTCTGAGCTGATAATTCTGAAGCGTTGTCGTTATAATTATCTTGCAGGAC +AGGAATAACTTTGGTATTGATATAATCTAGTACAGTATCTTGTGGAATACTCTCTATGTT +AAAAGCTATTAATTCTAATTCTCTTGTTTTAGGTGCGTTGAGCTCTAGAATGGTTTGCAA +ATCGCTGTATGCCTTTTTGTTGTGTTTGGGTACCGTATCAATGATGTTTTGCAGAGTTCC +CATCTTATTGATTCTGTTGGAGATTTTTTCTTTTTGTTTTTTAGATAGGAAATCAAACTT +ATCATAATCTACATCTTTTAGATATTTTACAAAAGGGATTCTAGCTTGTGTATTTTCGTT +AGCTATAAATCGTAAGGCGACTTCTGGTAAGAATGTGGCTCCATCGTTGAAATAATCTTC +TACATAATCGATGTAGCTAGGATTTACAAACATATTCTTTTTATCACCTAAAGCGACGAC +TATCCGTCGTTTTTTTATATCTTCAGGAAGAGTGTCAAGATTTTGTGGACTAACAATGTA +ACTATCAAGTTTACCTATTTTACCTGCAGTAACAATTATAGTTTTTATTGATTCTTGAAA +ACGATTGACTTCATAAGGAGTCAATCCTTGGTTTATTTTTCCTATATCTGAAAAAATTTG +TTTATAGTTATCCGTTCTTAGAATCGAATGTGAGATGTTTAAAGAAGGATTATTTACAAT +TTGTTCTGTAAAACTTTGATTATCCTTTTCGTATTCTACAACTGTGATTCGATTAAGATT +TTTCCTCATGTCATCATTTGGAAGCTGTGAAGCAAAATCTGTCAATAATTTTTGAACATT +TCTATCAGTAAGAGAATATCCTAAAAAAATAATTGGTGATTGAATTAAATTAGAGAGTAT +TTTTGCACTGATTAAAATGGAATTTTGATCATAAGCTTCATAATCATTTTCTGTGATAAT +AATACTGCTAGGGTCGTTTACATCTCCATGAATTTTGAACAATTCTGACCAGTTATAGGT +TTCGTCAAAAAAACCTTTTTGACCAATATAAACAGTTGGCTTTTTATCTAATTCTTCAAG +TAAATCTTCTGTTAAAGTGTCATAATTCGTAGTCACAATAACTTTAGCTTTCGATAGAAA +GTTCTTATATTCTTCTATCTCGTCACGCATCTCATTTTTAATTTCATATTTTGAAAAACG +CTGTGCAACAGAGTATTTAAAAGGTGAAATGTTATTTGAATAAGCTTCTTCATCGGTAAG +ACCCTCTACAGAAATGGTTCCATCATAAAAGAGGTCGTCGAATCTTTGCTGGATGTAAGC +CGCAGTCTTTACGTTAACTAAAAAATCTTTTTCTAAATCTGTAGTAGTTTCTGGAATTTC +CGATCTTTTTAGTGAGCGTTTGAATTGAAAAATACTGGTTGGTTCTTTTATTTGCTCCCA +ATATTCTTTGAGGAGAGCATCCCAGGTAGGAAAATTTTCCAAATAACGTTTTGACATTCC +AGAGCCAATAAATACAATTGGATAGCTATTGTTTTCGATAATATCTTTGATCATATTTAC +CCTCTTTCATTCCCCCTCCTAATCTTATCCCCTATACAAATCTACAACTTTACCGATAAT +CCTAAAGTCGCTATCGGCATCTACTGGTATATCGTCATAGTCAGAGTTTAGACTATGTAG +AAATGCGCCTGCGTCTCCTAGCAGTAGTTGCTTGATATAAGCGTCACCGTAGTACTCAAA +AACGCCTATATCGCCGTCTGACAGTTCTACGGTGAGCTTGACAAAGACATAGTCGCCAGA +GTGGTATTCTGGCTCCATGGAGTCGCCATAGACTGGAATAACAAAGTCTGCATCAACATC +CACTGGCAACTCAATCTGTTCCACTTGTACATCGTTCAGATATTGACCTGTACCTGCCGA +AGCAGGCTGGTCGTAGTAGTTGTAGGAGTAGAGGGCGCGTGGCTCTTCTACTGTATTGTT +ACTGTCTTCTGCTGTACTTTGTTTATCTAGGAGGCCATTTCCGTAGCGTACCCAGCGTTT +ATGATTATTCGGGTGTAATTCCTTGTCCAAGTGCAAAACGTCTGCCGAGGGGCTGTCTGG +GGCTTTCTGTGAAATTGCTGGAGATGGTTTTGAACTATTAAATAGGGCTTGCGGTGTAAC +ATTTAGAGCTTTAGCGTATGTTCTTATATCCAATTCATCTAACTGTCTCTTCCCGTTTTC +GTGATTTGAGATTGTATTTTGTTTAAAACCTGTTAATTTTGCTAAATCCTTTTGAGTTAG +CTTTTTTGACTTTCTTATTGATTTAATAGCATTTCCAAGGATGTTCATAAGCTTCGCATT +CCTTTCTACATATAATATAACATAATGAGATAAAAAAATAAACAAAAAAATCTCAAAAAG +AGATAAAAAACAGTTGACAAAATATCTCAAAATGAGATATAATATAATCAAGGTCAAGGA +AGTGACCTGAAAATAACAAAAGGAGGTACAGCTAATGGCTAAACATGAAAAAGAGCCTAA +ACACAAGGAACTAGAGTTCGAAGTCAGTTTCCTTACGTTTAAGCTCAGATTCAAATTCAT +AATCAAGTGGTAGCTTGATTAGTGAGGGGCGTAAGCCTCTCGCCCCGTTACGGGGTGTGG +TTATAGTTTAACATATTTAGTTGTACCTTCGCAAGAAAGGAAGTAGAAACATGAAATGGA +AGAAGTTTCTTTTTGGTGACATTCATTATAAAAATGAATTAGCAGATGGAAATCAAGAAG +TAGAATTCAAACTAAAAGGTGGATTAATCCCTAATTTGGTCTTATTGATTGGTGTTATTT +GGCTTGTTTGGCTATTATTTAGATAGGAGGGCGAATGAATATTATTATTGTTATTCTTAT +TTCTTTTATGGTGTCGGTTCTGTCTTCGTTGATAACCATAAAATATGTTACTGAAACATT +GGCAGCTTCTTGGTTACATATTTCAATTGATAGTTATCGAAAAGCTCAGGAAAAATACGA +AAATTTAGTATAAAGAAAGGATAGAGGGATGAACGAAGAAGACTTGAAAGAATTATTGGA +ATTCGTAGCGACAGATTATGGACGAGGGTATCTAGATGGAGTAGTTGGGGGAGTTTCAGC +ACTTTTGAAAACTTCAAAAGAAGCAGAGTGAGTTCTCCGCTTTCATCAAAATTATTTTGA +TAGCTTATCTACAGCTTAAGGAGAGTAGGGGGAACATTGTGAACGAACTTAAAATCCGTG +ATGACAAAGTATCTTTGAATGGCGAAGAGTTAAAAACTTTGACTAAATTTGAAATAAAAA +GCACAAGAAGCGCTAGGAAGGAGTAGAATATGGCTAAATCAGTAAAACCAGTTTTGTTAA +TAGAAGTTACTGAAAAACGTGGCACAGGTAATGAGGGTGACCCGGCAAGAGTTGTAGTTC +AATATTGGGATTACAACAATAACTTAATTTTTGAATCAGACCCAACTAAGAGGGATTAGT +TATCTCTATTTTCAATAGCTTTTCTATATGACTCTGGTAGAGAATTGTACACCTCAGATA +TTTTTTTAGGTTGAGTAATTCGATTATCTATAATCAGGTTGATAAAATGAAGTAATGAGA +GCGCTAGTTCTTTGTTATCTTTGATATTAATTTGTCCGGGATGAACAGCGTTATTCCCGA +TAACTCTAACACTATCAAGCATTTGCTGAATTTCGACAGGCATCCCTTTAGAAACTAACT +TTCCGATTTTTGAATTTAGATCTTTACCCTCGGCTTCAAGTCCGTCTACTAACTTTTCAA +TAGCCAATCTTGATAGTGCAGCTGAGGCTCTTGGAGATTTTTCAAGGATTTGACCGGCTT +CGATAAAGATTTCTTTGACATCGGACGGCATGTTAACGTTAGGTTTAGGGACTTCATTGG +ATACACTAGGAAATAATAATTTAACATTCACATGACTCTTGTCTAATTCAGCATATGAAC +CCTCTTTTATTAAAGGGAGTTCATTTGTTAACCAAATAGAGAAGTGTTCACAAGCTTGAC +ATTGGGCGATGATGGTAAACCTTAATGTTTCGGAGTATCTTTGGTGGATCACAACAGGTT +CATACATCCATAGATGAGAAGCGAAACCAGAACAATTTGGGCATTGAAAAGCTTTTGAGT +TACCTCCAAACCCACCACCTAAAGATAACTGTGAAAAATCAAATTCCATAACATTCTCCA +ATCATTTTATTTCCATTATACCATTTTAGAAAGGGGGTGAGAGGATGACGAAGAAACAGC +GTTTAAAACAACAGCATCTTAAACCTAAAAAACGACTAAGAGAAGAGCGTCTTAAACGTG +AATACACAGAAATGTACATGGCTGATTTAATTGGTTTGAAAAATCGCAAAGGTTATTCTG +AAAAAGAAGATGGATTGCAAGCATTCAAAGATTACGAAATGGCTATTATTTCTGAAAAAT +TTGGCATTTCAGAAGCTGAATTATTTTTTTAAAACAAAATATCTCAATATGAGATAAAAT +TATTAAGAATTAATAGATAAAAACAGAACTTCAATAAACACTTGCCAGCTATTTAGAAAG +GAGCTATATGAACAATTTAATCAACGTAACTTTAAACGAAAACCAAGAGCCAGTAGTTAG +TGCAAGACAGCTACATAAGAGTTTAGAGGTAAAAACTCGCTTTAGCCAATGGGTAGAACA +AAATTTTAAAATTCTGGAAGAAGGTTATGATTTTACAAGTGTAGTCGGAACTACGGTTGT +AAATAATGGCGCAAATAGAAAATTGCAAGATTATGTACTATCTTTAGATGCTGCTAAAAA +TTTAGCAATGGTATCTAAAACTGATAAAGGTAAAGAAGTTAGACAGTACTTTATCCAAGT +AGAAAAGGACTTCAACAGTCCTGAGAAGATTATGGCAAGAGCCTTGCTCATGGCAGATAA +GAAAATCACAGTCTTAACCACAGAGAATGAGACGTTGAAGCTTGAACTTGAAGAAGCGCA +GAAACAAGCCAGATACCTTGACTTAATCATTGAAAGCAAAGCAAGTTTGCGCGTGACACA +AATCGCTGCTGATTATGGCATGAGCGCTACTAAGTTTAACCATCTTTTGCACGAATTTGG +AGTGCAACATAAAGTTAACGGACAATGGATTTTGTACAAGAAATACATGGGCAAAGGCTA +TACAGATAGCGCAACCTTTGATTTCGTGGACGGCAAAGGTCAAGCACGCACTCATGTTAC +GACAACATGGACGCAGAAAGGTCGCTTGTTCTTGTATGAATTGCTTAAAAGCAAGGGGAT +TCTGCCTTTGATTGAGCGTGAGGATGATTAGGAAGGGGCATAAATGGGAATTTTTGAAAA +AAGGGAGCTGGATTTAGCTGAGCGTAAAGTCTTGAAAAACGACTTTATGAACCAGTGGCT +TGCAGCTATTGCAAGAGACCTCGCTAAAAACTATGACAACGAAAAAAGCACCCTAGCAAA +GTGCGAGATTGCTAAAGTGCTAATTGAGATAAAACAGGCTCTTAAATAAGCCAGTCTTTA +ACTCTTTGCTTAGCTTCTTCAAGCTTTTCTTGATTGTGATTTTCGATAAATTCAACGGTT +TCTTCGTAAAGTTTGACTTTATCAGAAATACTCAAATCAGGATTCGAAGACGAAACAACA +GCTAAAGCAAATTTTTCAGCATCTATGCTCATAACATTCACCTCCTCTCTGCTTTCTTTT +ATTATAGCAGAGAAAAAAAGTGTAGAAAGGAACAAACATGAGACCAAAACGTTATCCGTA +TAGTGGGAAGCAAAAATTGTCTATCGTAACTTCGATAGACACCGAAAAATTTTCTAATGT +TTTAGATAAAGCATTAGATACTAGTTTTCAAGTACAAATAGGAGGAAGTAAGCATGAGAC +CAAAAAAGTATCCGTATAGTTTTAAAAAACAGCCTATCCAAAACTTAGATAGACTATTTC +ACAATATAGAAATCAAGCCAAATAATGCAAATGGTGTTCCGACAGTTATTCTTGACGGCG +TTGATATCGTAAAGGAAGGTGGAGGGCTGGTTTCGGTCAATCTAAATTGGGAAACATTGA +CTGACAATTCATCAGGTAAAAATACTTTTTCTATTGAATATCTAAACAAAAAAGGGCAAG +TTGTAAAACTTACCCAAGGTGCTATTGGTTTTTAATTAAATCGGAAATAATATTTGCTGC +TGTTTGAGACAGAAAATCTAATGTAAATACACCTATTTTAGAAGCTCTTTCCTTGGTATC +TCTCCAAATCTTAGGACTTCTAACTGTATCAAGGAATTGATGCCCTTCATAGGTTAGACC +CGAAAGAGTTCCATTGTAAAATTTATTATTTCCAAACTGAACTTTCCAATAAACAAAACC +CGCTTCTTTAAGCATTTTAAGATGATATAAAACAACATTTTTATCTAACGAGTTTATTCT +AGGAAAACGTTCAAAAGAACTTACAACTAAATGTTGGGGGTACTCATGTATTTCTTCAAT +ATCCAAAAGAATATCGCGAGCAATTTCTGGATCAAACTTCATAATAAAAACCTCGTTTTT +TGATTACATTATATCAAATTTAGAAAGGACAGAAATGAGAAAACTAAAAAAAGCCTTCGC +TATGCTGGATAACGAAGACCTTGCACTATCGATAATCGGCGCTGTAATCACATGGTTGTT +CATTTGGTTATCAAAATGAATTAGCAAAAAGCCACTGCGGGAACAGTGGCAAATCAAAAC +ATTACAAGGATATTTTATCATGAACGATTTAATGATTCAACTACTCGACCAGTTCGAAAT +GGGGCTGAGAGAAAGAGCTATAAAGGTCATGGCTACTATCAATGACGAAAAGCACAGATT +TCCAATGGAACTCAATAAAAAACAGTGTTCGTTGATGTTGCTGGGGACTACAGACACCAC +AACCTTTGATATGCGTTTCAATAGTAAAAAGGACTTTCCTCGTATTAAAGGAGCGCGTGA +AAAGTATCCACGAGATGCTGTGATTGAGTGGTATCACCAAAATTGGATGAGGACAGAAGT +GAAGCAGTAAGAAATTGGCTTAACAGCGACTGGCAAGATATTGCCTAGAACATAACCCTA +GCTGTAACAGTGAGCTAGTGAGGAAGCTGAACGATACCAACAGCAACAACGATTTGATAT +TCATGACTGTCTCCTTATATATTAAAAAAATATATGAAAAAAACATCCTCACTAGTTTTC +TAGTGCGGTTAGGGAGTAGAAAGGAAAGTAACAATGGAAGAATTCGGGGTGTTGCTGGCT +ATGGCAACAATAATAGGCTCGCTCTTATTCGCAATTTGGCTCAATCATTTTCTGTTTGAG +ATTGCCCCTTTCGTCCGCGCTTGGGGACGTAAAAATATTTCAAAACTATGGGATAGATTA +AAGCGAACAACGAAACGATAGCTGTGGCTAAAGTGAAAATTTCTTCAGTTAGCGTCATAG +CCAAGGAAACCGTGAAGGCTAGTGCAGTGTAGGTTGTAGCAAAAAGCTTTGCAAACTCTT +CTGCATACCTTCGAATAGAGGAAGCAATTATAAAATACAGCAACGAAACGAGAATAGAAC +ACGAAGATTTTAATGACAAACATAGTAAGAGATAAAGCAAGAACGATAGTAGTTAAAATG +CCAATCAGTTTCAAAAAAATATTTAAAAGTTGTTTTAATAATCGTCTCATCTTAAACCCA +ATCTATTTTTTTAAAAACCATTTTATCAGAAAGGAAAACACTATGAAAGCATCAAAACTA +TTTAACTGGATTTGGAGCGAAAAACAACAAGAAGAATACTCCTTCGAACCAGTATGGACA +CCACGAGAGATTAATGACCAGAAATATGAAGCGCGTCAAAGACGTGAGCGGTATCTAGCT +GCTAAGTACCTTAGCAATAATTAGATCACTAACATCTCTCAGCGTGTAGCCATAGCCCTT +CCGTGGAGTGTAACTTATACCCATTTTTCCCCAAAATATAAACTTTACTTTACCCACATA +TCTTTCTAAAAACACATTTACAAAGCGGTGGGGCGATGGGTGCACGTTGAGAGCACTAAA +AAAAGCATGGGTTAGGGCCCATGCAAGAGAAACTCTAAGGAGATTATACCATAATGATTA +AGAAGTTTGAATTAGATTTATCATCTAAAATCACGGCTTGGGGAATGGAGCTGTTCAGAA +TACGAGCGTTGATTTCGTTTGGAGACGTGAAAAAAGGCGATTTAGGCGGGTATGTTGAGA +AAGAAGAAAACCTAAGCCACTCTGGTGGCGCATGGGTCTATGGTGACACATGGGTGACTG +GTGACGCTAGGGTCTTTGGGAACGCCGAGGTATTTGGTGACGCGTGGGTCTATGGGAATG +CTAAGGTCTATGGGAATGCTAAGGTCTATGGCGAAGCTAGGGTGTGCGGTGATGCTGTGG +TCTCTGGTAACGCTAAGGTATTTGGTGACGCTGTGATCTCTGGTAACGCCAAGGTCTCGA +AATTAAACGACTACATCGCTTTCAAAAACAACTGGTCTAGCGGAAGATATTTCACTTACA +CACGCTCTAATAAGATGTGGCGTGTCGGCTGCTTCTACGGCACTGGCGAAGAGTTAGTTG +AAAAAGCATACCAAGACAGCGAAAACAGTGGCAAGCACTATGAGGCCTATGTCAATTTAG +TTAAAACGCTGGAAAAACTGGAAAAATAAATAATAGTAGTCGAAGAGAAACGAAGAAAAA +GGAGAATATATCATGAAACTAACAGAAACACAAGTCGTATTTTACAGTGCAAAAAGGGAT +GGATTTCTTGGAAAATACAAAGACAGAGGCAGCCTAGCATTTGAGGCAGGTTTTACTACT +GAGTTAAGAAGTGCACTAATTTTACCGCTCGATTCGTATGAAGAACAAAAAAACGAGCTT +GATAAGCTTGCTGAAGCGTTTGGCTGCGAAGTGCTTAATGTGGAAGTTGAATATAACATA +ACCAAACTTGACGGTTCTGATTTCGAACGCACAGAGCGTGAAGGACTCGAGAAAGATGAT +ATCAAAGCACTCCTAGAAATATTGGCAAAGTAACAAGACAGAAGTGGTGGGAGGGTAGGC +GTTAAACATGGCAGATAATCAGAAATATTACACAGGAGGCAAAAAATGGGAAACCGTAGA +ATGATAAGTAAAACTGTTACTCAGACCCATCGATTCTTACGTTTGCCCCTAGAAACACAA +GCTCTTTATTTTCACCTTATTCAAAATTGCGACGATGATGGAGTAGTGGAAGCGTTCCCT +ATTCTCAGAATGATAGGGGCTAACGAGGATAACTTAGGGCTTCTAGTCATCAAGCAGTTT +GTAAAACCTCTTAACGATGAAATGGTTTATTTCGTGGTTGATTTCCACGAGCAAAACACT +GTCAGAAAAGACAGATATGTGCCTAGTGTTTACAAAGAATTGCTAGAAGAGAATACCGAT +GAAACCACTGGTAAACCACTGGTAAACCAAACGGCAACCAGTGGTTGCCCCAATATAAGT +AAAGATAATACAAGTAAATATAATTTAAGTAAATTTAACAGTAGAGAGGATGAAACATCA +GAAAAAAGTCAAATTTCTTCTTCTGCTGCTGATGACCAATCAGATTTTAATATTTTTGAA +TATTACCAAGAAAGAATCGGGCCTATCGATGGATACCAAATGGAAAAACTAAAAGGCTAT +ATCGATTTTGATAAGTTGGAAATCATGTTGGTCAAACGTGCCATAGATAGAGCTGCGGAT +AACTCAAAACGTGGTTTTGGCTATATCAACTCTATTTTAAAATCTTGGGCACAAAATGGG +ATTCATACCATTGCCCAGCAAGATGAAGAGCAACGTAAATTTGACAGCCGTAAGAACTTT +GATGACCAACCAGCTAAATTCGGTCCAGCTTGCAGCAAATATTAGAGGTGCTGCTTATGA +GTTTAGAACAGACAGCTAGGCAAATGCGAAGGCAGTATATGACCACTAGCGAGAAATACT +GCGACAAGCATCAACGGCACTATGTCACAATCCAGCTCCCAAACAGCAAACCCTATACCG +TATGCGAGATGTGCCATCGTGAGGAGCAAGCTAAACAGAATGCCATCAAGGCACAAGAAC +AGTACGAACGTGAGCAAGAGCAGAAGCGACTGTACTTTCTCAAAGATTTTAGCTTGATGG +ATGACGATTTGAAGAATGCCAGTTTCGATAATTACAAGGCGCTAACCAGAGAGCAGAAGG +AAGACTTGAAGAATGTTCGGAGTCAACTCAGAGGCTATCTTGATGGCCAGGACTACAACA +TTGTCCTCATTGGTGATACTGGTGTCGGCAAGAGCCATCTAGCTTATTCAGCGCTCAAAG +CTTTATCTGACCACACCAAAAAGATGGGCCTATTTATCAACATTGTAGACTTGCTAGCCA +AAATCAAAGAGGATTTCAGTCTTGAGGCGGAGTATATTAGACGCATTTCGGAAGCTGAGT +GGCTAGTGCTCGATGATTTGGGAACTGAAAAAGTGACAGAGTGGTCTAGTGGTATCTTGT +ACAGCATTTTGAACAAGCGTACCAAGACCATCATCACGACCAACTTAAGCCCACGAGATA +TCATGGGTACTTATGGCAAGCGTGTCTATTCGAGGGTCTTCAAGAAGACAGGACTCGAAA +CTACGAACGAGCACGTTTACCAATTCAAGACACAGCAAGACAAGAGGATGATGCTTTGAC +GGAAGAAGAAGTAAAACTAAAACTCTTTGAAGACTACGAGCGCATTCACGGCCTTGTATT +CTCAGAGGAGCATAAGCAGAAGATGATGGATGAGCTAGATTTATACTCATTCATCAGCAA +AATCAACGAATATATGTATTTCGCTAAGAAATCAATGCAGATTTTTAGCACACACTAGAA +AACCCCTCTAAAATCGATTTTAAGGCGTGTGTTTTGCTTGGTGGTATAAATAGACTAGAG +CATCATTAAAATTGCACTACACCCTCTTAAAATTAGAAATAAGGGTATTTAAATCAAAAA +GGAAGACGAAACATGACAAATCAATTAGCACACAAGGACTTTTTTAATACACCAGCGGTT +AAACAGAAATTCCAAGAGGTACTCAATGGAAACGAGCGACAATTTACCGCAAGCCTCTTG +TCAATCGTAAACAATAACAATCTACTAGCAAGAGCTAGCAACACTTCAATCATGACGGCA +GCAATGAAAGCAGCAGTCCTTAACTTGCCAATCGAACCAAGTCTAGGTTTCGCTTACATT +GTCCCTTACAAGCAAGACGCACAATTCCAATTGGGATATAAAGGGCTTATCCAACTAGCT +ATCCGCTCTGGTCAGTTTAAGGCCATCAACTCTGGCAAAGTCTATAAAGCACAATTCAAG +TCGTATGATCCGCTATTTGAAACACTAGATATTGATTTTACTCAACCGGAAGATGAAGTC +TACGGCTACTTTGCAACTTTCGAGCTAGTCAATGGCTTTAAGAAGTTGACATTCTGGACA +AAGGAACAAGCAGAAAACCACGGGGAACGCTTTTCAAAAACTTATGCAAGAGGCCCTTGG +TCTACTGACTTTGACGCTATGGCTCAAAAAACCGTGCTTAAGAGCATTTTGAGTAAATAT +GCCCCACTCTCAACAGAAATGCAAGAAGGCCTTGTATCAGACAACCAAACTGAAGATGTC +AAATCTGACCCTATCGATGTTACACCAAAGAATGAGGACACCCAAACGCTTTTAGGTGAC +CTCATGAGCGATGAAGCTGAATCTGAAAAAAGCGTAGACGCTGAAACTGGTGAAATCATC +GAAGAAGTTAGCTTGTTCGAAGGTGATTCAACCAAAATCAAAGAGGTAGACAATGACTGA +ATTAACAATATTGACAGAGGATAATTACTACTCTGATAAAACCTATATGTCTGCAAGCCG +TTTCAAGGAATACATGAAATGCGAAGCTAGAGCCAAGGCTATCGATGATGGTATTTGGGA +AGATGAGCGCGATCAAAAACCTTTGCTCTTTGGCAACTATGTCCATAGCTATTTCGAAAG +TGAAGAATCACACGAAAAATTCAAAGAAGAGAACAAAAAAAACTTATTCTCTAGCCGTAA +ACCCTATGGGCTGTTATCAGATTTCAAGTTGGCTGAAAAGGTTATCGAAACGCTTAAGGA +TGACACTCTTTTTAACAAGCTTTATCACGGAAAAAAAGGCGACAAAGTCGAAAAGGAAAA +GATTGTCACTGGATTCATCGCCGGTGTGCCATTCAAAGGGAAATTGGATAGCATCAACTT +TTCAAAAGGCTATGTGGTCGATTTGAAAACCATGAAATCCATCTGGACTAAAAAATGGTC +TGAGGAATTGCATGCCAAAGTACCAACGGCAGTCAACAACATTCTAGGGTTTCAATACCA +TGTCCAACTAGGGACATATTTAGAGTTGCTACGTCAAATGGACTATCCAACATTCAAACC +ATTTATCGTGGCAGTCTCGAAAGAGGAACAGCCAGATAAAGAAATCATTGAATTGACGGA +AGAATGGCTAGACGAGGGGCTTGATTACATCACTAGACACGCGCCTAGAGCCTATCAAGT +AATGCTTGGAAACGAAGAACCTAAGAAATGCGGTCATTGTGATTATTGTAAATCTCAAAA +GAAACTGCATGAGGTTCTAACACTGGACGATTTCTTAAATCGTGAATAAAGAAAGGAAAA +ATCAGATGATTAATAATACCGTGCTTGTTGGTCGTCTCACCAAAGACCCAGAGCTACGCT +ACACGCCTAGCAATGTCGCAGTGGCTACATTCAGCCTTGCGGTTAACCGTATATTCAAAG +ACGCTAACGGCGAACGTGAAACAGACTTTATCAACTGCGTTATCTGGCGTCAACAAGCTG +AGAATTTGGCTAACTGGGCTAAGAAAGGCGCATTGATTGGCATTACTGGACGCATTCAAA +CCCGTAGCTACGAGAATCAGCAAGGTCAACGTGTGTACGTTACTGAGGTTGTCGCTGAGA +ACTTCCAAATGCTGGAAAGTCGCAACAGTCAAGGTAATCAGCAGAACCAAGGGAACTCTT +TCCAAAATGGAAATAGCTCGAAAGCCGGAAGCGTCAACAATGGATATAACCAGCAACCGC +AACAGCAAACGCCAAACTTTGGGCGTGGCAACTCAATGCAGGGGAACCCTATGGATATCA +GTGATGATTTGCCCTTCTAATAAAAGGTGATGCAAATGAAGTTTAAACCGATTAAAGGAT +ACGAGGGCATCTATGAAGCGTGCTCAGACGGGACAATTTGGACGTGCGAAGGGAAGACAA +CTTATAGTAATTGGCACGGAAGAATTAGGAAGCGTGTATGGAAGCGTAGAGAAATCAAAC +CACAGATACAAAAACGAGTAAGAAGCGCCCATAGTGATAAACGAGTGAAGCTGTGGAAAG +ATGGGAAAGTGGCGACACACTTGGTAAGTAGATTGGTAGCAACTGCATTTATTCTGAACC +CAGAAAACAAAGGGTTTGTAAATCACAAAAACGGAGAACCGTTAGACAATTCGGTAGAAA +ACCTTGAGTGGGTGACTAGATCCGAAAATCAAATACACGCCTTAAAAACGGGGTTAACAA +GCGCAAACAAAAAAGTCGTTCTAAAGGACATATCAAACGGCGCAGAGCACCACTTCAACA +GCTTGACAGATGCTAGTTACTTCCTAGGGAGAAATCACGGCTACCTCAGTCTAAAAATAA +AAAGAGGTAAGGGTGTAGACGGCTACGAAGTTAGATTGGTCTAGGTGTTTCATGGAAAAA +TTGATTTTAAAATTTGAACTTGATAGAAAACAAATGATCTCAGCGAATGACAGGATGCAT +TTTCAGCAGAAGGCTAAAATCACAAGGTTTCTACGACAACTAGCGCATTACGAGGGAGAG +AATACTTTAAGAGATTACTTTGGTTTACCTTTTAACGAAAAAAAGCCTTGTAAAGTGATT +GTCTGGATATTCGCCCCGACAAATCGCAGATACGACCCCCCAAACTGGTCACCCACCAGT +AAAGCCCTATTAGACGGCTTGACTGATGCAAATTTCTGGACGGATGATAACTACCACATC +ATTAAGTCAACGGATTTCAGACATGGCGGGAAGTCAGGAAATAAGAAATACAGGATTGAG +CTTGAAATTGAGGAGTTGGAATAACAAGGAGGAAAACGACAATGAAAAAATTTAACGGTG +CAATGGTTACGAAATTCAGAGAAAAATACGGATGGACCAAGACACATCTAGGAGAGTTGT +TAGGTGTTTCACAACAATCTATCACAGACATTGAATACAATCGCAACAAGACTGAACCAA +CTCGAGAGTTTCAAAATAACTTGGCAGAAGTTTTAGGAGTGTCTGTCAGTGACTTTTATA +GCGAAGAAAACGATATAGAATATAATTTTAAGCCATCAGGTTCAAGAAATAGTAGTCCAT +TCAAGAAAATAGAGTTTGGGATAGAGCAATTTTTAAATTCGTCTAAACAATATGATGTCA +TCGTAGAAGTCGAACGAATTGGCATTAAAAATTCAAGAATGGATGCGTATGATTTCGTTG +ACCTGTATGGCGATAGAAGAATAAGAGGAATAAATACAGAAATTGAAAAAGAGGTTACCT +CAACATATCGAAACGATGAATTGATATACACTGATGAAACATTATCTAGTGTAGTTGTAT +TGTATGTGAAGGCTAACAAGAAGGACAATGAGGAATAAAAATGAAGTATAAAGTAACTGA +ATATTTCTCAGATGTTCGAGAAGAGCAAACTGGAACTTGTGAGCTATGCTATGGGACCGC +TTTGGTCGAAAGTGGTTCAATCACAGTTGAAGACGAAAACGGAACGGAAACAGAAATCCC +ATTGACAGACTGGAATTGGGGTGATTTTGACACAATCTATATCGACAATGTGGTTAATTT +CTCTGCATGGTTGCAAGAAAAAGAAGTTGAACCAATCGCTGAAGAGACAAATGATTGGTC +GTGGTTGAATGAGTTAGTAGAAAAATATGACGAGGAGCAGAAATGAATATAGAAGAATTT +ATTGAAACTATCAGAGACGCAATTGATTTAATAGAACAACTAGACGAACCACAACCGTTG +AAGCTAAAAGATATCACAAGCCGAATGAAAGAGCTAGATTCTCATGCTCGGTCAGAATGG +ATTGATGTAATCTTACACGAATTCGGTGAAGAGTTTGGTTCAAAAAAATATCGTGACGGA +TACGAGCAAGGCAAGTTAGAGGGAACTATCGAACATGTTAAACCAGTCGTACCGCAGTCT +GTGGCGGATTGGTATGAGGAAATTAAAGGTGAATTTTACTTAAACTTACATTACTTGGCT +TGGGATATGTTTGAAAGTTTGGACGAAGATGCCTGTGTACCTAAAAAAACATTAAATGAC +GATATCACACGTTGGTATCGCAAAAACGAAAATGCTATCAAAATAATTGTCAACATGCAT +CAGTTTGGCTACGAGGTGGAGAAAGAGACGAAGTACACTGTCAGAATCAAAATCACAAAT +CAATATTTATGCAGCGATGAAGGCCACCTTCATTTTAGTCCGGGTTTTAGAACTGATTTT +ACAAAAAGAGACCTTGAGGGGTTAGGTTTCGGATGGGTATTTGATTGCGAAGGAATTGAA +ATCGAGGAGGTGGAATAGATGGCTAAGTTTATCGAAATTGAAACGTGGTATCAAGGACAC +TCCCATATTGAAATTTTGAATATAGACGACATCGGGCATATAAGTGTCGGGCCAAACCTT +ATCTTTTTGAAAACTCCATACGCTGACGGCTCAAACGTGACAAGAGTATCGTCTGAAACC +ATCGAGAAATTAATGGATATTTTAAAGGTTAAAGAGGTGGGATGATGAACAGACTTAAAC +GGTTAAGAAAAAAGAAAAGGCTAACTCTTATGAATTTGTCTAAAGAGTTGGGTTTGCCAG +ACAGTACACTGTCTCAATACGAGAACGGCAAAAGACAAATCAGTATAGGCAAAGCCAAAA +AGCTAGCTGAATACTTTGGTGTTAGCGTTGGTTATCTGTTAGGGCTTGATACACCAGCAA +AGGACGGTATCCCAGAGCTTATCACCAAGGTTAACGAATGGGCTGATGACCGCAACCTTA +AACAAGCAGACCCTAAGATACAGTGGATGCGAATCACTGAGGAAGTCGGAGAAATTCGAG +ATGTACTCTTGAAACCGACGAAATTCACGGAACCACAAGCAGCACTCAAGGACGCTATCG +GAGACACGCTAGTAACGATTATCGTGCTAGCACATCAATTAGACCTTGATGTTACTGAGT +GTCTAAGCGTTGCTTATGAGGAAATCAAGAATAGAAAGGGAAAGATGGTAAATGGAACAT +TTGTCAAAGAAGAAGACCTCTAAACGAGAAAACCAGCTAGCAGTAGCGACGATTCTGCTA +GCGCTATCGCTGGCGATTAACGTGACTACTGTCCTACGAGTGGTTAATAGACCTATCGAG +ATGGTACTTATCCACAAGGCAGATAATGCGGTAGAACTACATGGCAAGGTCACTGGAAAA +TCAATGGTAGGCAAGCTCTACACGATTGATTGTGGAGCTTATGGTAAGTTTCTAGTGAGC +AAGGAACAGTACGACCAAGTAAATGTTGGGGATGATATTCCGAGCTATTTGAAAGGACGG +GGGCAATGAACAAACGACAACGAAAGAAGCAGTTTGTCAGAGAATTCTCAAAACTTTATG +ACAAGAGTTTGGAACACGGAGGTTTTGAACGAGGGATGTCGATAGCCACTTTCAAGGACA +TAAGAGGAACAATAAGGATGTTTCTGACGCTTAACAAAAGCATGAGCTATGATTTTGGTT +GTGGCGAGTTGCCAAGTATTTCATTCGATGGGTACTGCCTTTGCTATAAAACGCTGAAGA +GGTGAGAATAATGATACCAAAATATCGAGCGTGGGATAGAATTCGTAAAACGATGTATGA +AGCGGATGATATTGTGTCTATCAATTTCGGAAAAAGCGAAATTTGTGTAAAAACACTCTT +TTTTGAACAGGTAAATCGCTACAATTTCGATGACATCGTATTGATGCAATCAACTGGACT +AACCGACAAGAATGGCAAAGAAATCTTTGAAGGGGATATAGTTGATTCGGAGGGTGGTTT +TACAACCGGAGTAGTTGAATTTAGATCGGATTTAGGGATGTTTGTTAGCACCTTGATTAA +ATATAATAACTTCGAACGGTTATGTAATGCTCACGGTTTGGTAAAGGTTATCGGCAACAT +ATACGAAAATCCGGAATTGTTGGAGGTGAACTAATGCCTAGTAATTACCCCAATGCTGGA +CTTACTAAGGAACTATTCCAGCGATATCGTGAGGAAGTGGAAGAACTGAGAGCTACTTAT +CCAAACAGTATCGTGGCACATATCATGGAAATTAAGGGCTGCTCGAAGAGAGAAGCTAAG +AACATCGACAGTGCTATCAGTGTACTCTATGTAGAACATGTTAATCTGACACCTCGTAAG +GTGATTCAGTTAGAAGGATTGCTATCCAGAGAGCTATTCAGTGAGATAGCTAAGTATGTA +TTCAATCACTACGAATGGCCGGAGAGTCTAGATAGTGAAGTTGACCGTATCACTCTTGAA +TATCGGACACAGGGGGAGTTGGGACGCAACAAGCCAAGCGTTAAACGTTATCTGTATCGG +GCTTATGCGCTTGGTGTTTAGGTGGAAAAGAAAAAAGCCGCAGACTAGTGCGACTCTTTG +TTACTCAACATAACTATATTATAGCAAAGAAGGTCTGCAATGAAAACTAGCCAGCGATTG +AAAGAGTTGAAAGCACTAGACAGATACATAGATAGCCAGCTTGAACGTATCCAAAAGCTG +GAAGCAAGTGCCACTAAGGTAACCGCCGCTTTGCCACAAGCAGACAAGATTTCTGGTGGT +ATGAAGCGTAAGCAGGATGACATCTATGTAGAGCTGATTGATGAGGAAGAAGAGGTGAAA +AAGCTATGTAAACAAGCGATACAAAAGCGCAGAGAGTTTTATAATCTAATCTATCAAGTA +GACGACTATCAAGCTAGAGATATGCTGACGATGGTCTATATTGATAAGCTGTCACGCTTT +GACATTATGGATAAGTTAGAGCTAACTGCAGACAGCCAATACTACTATCTGTTAAGAAGA +GCGCACAAAAAGATAGACAAACGCTGTTGATTTAAGTAAAACGGAGCGCAGTCTAAAATC +AAAGTGGTATAGTAGTAGCATAAAGAATTGAAACAAAGGCACCTTGGGTTTGAATCCCAG +AAAAGCTTCTGAAAAACTTCCAGCTTGGGTTACTGGTGGCGACGGAGTAGGATGTTTTAA +AGTCGTGCTAAATAATTACGGGTCCTGCAATGAGTCGAGTCACATCGGAGTCATTGAAAA +ATAAATGGAAAGGGTAAACATCTTGTGACGGATGCCTAAAAAAACGATACACAATCCAGG +TTGAGTGTATCACGCTTGTTTGTGCACCTTTTGGACAAGCGGTAGGAATATAGCTCAGAT +GGTAGAGCGACAGACCTTTAATCTGCATGCGTAGGTTCGAGTCCTACTTTTCCTATTACA +GTCACACAATCGTGTGGCTTTTTAATTTAGATTTGGAGGTGATTGACATAGCTAGAGTTA +GACGTTGCAAGTACGCAGGTTGCAGAACCTTTGTAGATATAAGCGACGGGTACTACTGCA +AGGAGCACGCAGACCAAGCACCTAAGCGTGAGGTATACTCACGTACGAAGTACAACAAGT +ACACACGCAACAGGTCAGAAGATAAGCGAGAGCAATATAATTTTTATCGAAGCAAGATTT +GGTCGAGCCTAAGACGAGTAGTCCTAGAACGTGACCACTATCTATGTCAATACTGTTTAG +CTCTAGGTACTGTCACACCGAACAGCAAGATAGGTGACCACGTCACACCCTTCGAGGTAG +CGCCTGAACTAAGGACGGACCCGAAGAACATTGCGACAGCTTGCAGAGCTTGCGATAATG +CCAAAAGGACGCTAGAACAGCAAATCTATGGCACAGGGCAAGGTAACACGTTGCATAACC +AACAACTACGGCTCACGGTCAAAGAATGGGCGCTAAAAATCAAGCACGCACGAGAAGCCC +TATAAAAAGCCCGTAGAGCAATTTTAATTGGCGGAGGTATAATTCATCAAAACAAAATTT +AAAACGTGCCCCCGCCCCTGTATGAGCCAAGGAAGAGCCACACAAAGGT diff --git a/non-regression-tests/run_HK97.sh b/non-regression-tests/run_HK97.sh index 2c1bc07884d0540ea4b3a16b2e950780287d3ee7..33a94c3452ba1e9eb5b96be2ba6de2065a0c7af6 100755 --- a/non-regression-tests/run_HK97.sh +++ b/non-regression-tests/run_HK97.sh @@ -6,3 +6,4 @@ SCRIPT_PATH=../phagetermvirome echo "running PhageTerm on HK97 genome" python $SCRIPT_PATH/PhageTerm.py -f $DATA_PATH/R1_1M_READS_EACH_PHAGE.fastq.20 -p $DATA_PATH/R2_1M_READS_EACH_PHAGE.fastq.20 -r $DATA_PATH/HK97_assembly.fasta || exit 1 python check_HK97_res.py || exit 2 +-r \ No newline at end of file diff --git a/non-regression-tests/run_HK97_long.sh b/non-regression-tests/run_HK97_long.sh index f73a421d50b34c06a2b654dd3efd4c1a124c9131..7fa5bfc109682a0a4cc296fcdb634174c919bc85 100755 --- a/non-regression-tests/run_HK97_long.sh +++ b/non-regression-tests/run_HK97_long.sh @@ -5,4 +5,4 @@ SCRIPT_PATH=../phagetermvirome echo "running PhageTerm on HK97 genome and a dataset with a minimum 50x coverage" python $SCRIPT_PATH/PhageTerm.py -f "$DATA_PATH/R1_1M_READS_EACH_PHAGE(1).fastq.4" -p "$DATA_PATH/R2_1M_READS_EACH_PHAGE(1).fastq.4" -r $DATA_PATH/HK97_assembly.fasta --nrt || exit 1 -python check_HK97_class.py || exit 2 +python check_HK97_n8_class.py || exit 2 diff --git a/non-regression-tests/run_HK97_long_multiproc.sh b/non-regression-tests/run_HK97_long_multiproc.sh index 97cdd3f3fb8335bd2279d015002d92ca0f7c708c..429dbbba9b48aedd6738dc78263dc3e7c692959c 100755 --- a/non-regression-tests/run_HK97_long_multiproc.sh +++ b/non-regression-tests/run_HK97_long_multiproc.sh @@ -4,4 +4,4 @@ SCRIPT_PATH=../phagetermvirome echo "running PhageTerm on HK97 genome and a dataset with a minimum 50x coverage" python $SCRIPT_PATH/PhageTerm.py -c 4 -f "$DATA_PATH/R1_1M_READS_EACH_PHAGE(1).fastq.4" -p "$DATA_PATH/R2_1M_READS_EACH_PHAGE(1).fastq.4" -r $DATA_PATH/HK97_assembly.fasta --nrt -python check_HK97_class.py +python check_HK97_n8_class.py diff --git a/non-regression-tests/run_n8.sh b/non-regression-tests/run_n8.sh new file mode 100755 index 0000000000000000000000000000000000000000..7807ed8899d896ebecc146e594e366671b2fdd05 --- /dev/null +++ b/non-regression-tests/run_n8.sh @@ -0,0 +1,9 @@ +#/bin/bash +DATA_PATH=./data +SCRIPT_PATH=../phagetermvirome + +echo "running PhageTerm to check that the rearanged sequence bug is fixed" +python $SCRIPT_PATH/PhageTerm.py -f "$DATA_PATH/n8_1.fq.gz" -p "$DATA_PATH/n8_1.fq.gz" -r $DATA_PATH/n8.fasta --report_title="n8" --nrt || exit 1 +python check_HK97_n8_class.py || exit 2 +python check_n8_res.py ||exit 3 + diff --git a/phagetermvirome/PhageTerm.py b/phagetermvirome/PhageTerm.py index 4894d27b4e8a36e5e6647bea2dfcac821db73362..e9104cc8396894f015a16745d3cc3774182c597f 100755 --- a/phagetermvirome/PhageTerm.py +++ b/phagetermvirome/PhageTerm.py @@ -39,7 +39,6 @@ from __future__ import print_function # Multiprocessing import multiprocessing -import os from multiprocessing import Manager @@ -47,7 +46,7 @@ from multiprocessing import Manager from utilities import checkReportTitle from functions_PhageTerm import * -from common_readsCoverage_processing import processCovValuesForSeq +from common_readsCoverage_processing import processCovValuesForSeq,RemoveEdge from main_utils import setOptions,checkOptArgsConsistency @@ -63,36 +62,6 @@ def main(): no_match = [] draw = 0 # used when one wants to draw some graphs. chk_handler = RCCheckpoint_handler(tParms.chk_freq, tParms.dir_chk, tParms.test_mode) - ## VL: keep this code just in case we want to try GPU implementation again later. - # if tParms.gpu!=0: - # ref_data = refData(inDArgs.refseq_liste, fParms.seed, inDArgs.hostseq) - # nb_extracts=inRawDArgs.tot_reads - # if (inRawDArgs.paired!=""): - # nb_extracts_per_read=7 - # else: - # nb_extracts_per_read=4 - # nb_extracts *= nb_extracts_per_read - # - # gpu_mapping_res_dir = tParms.gpu_mapping_res_dir - # wanted_gpu_nb_chunks = tParms.wanted_chunks - # mapper = GPU_chunkMapper() - # mapper.setRefData(ref_data) - # mapper.setFicDir(gpu_mapping_res_dir) - # nb_kmer_in_chunk = nb_extracts//wanted_gpu_nb_chunks - # doMapping(nb_kmer_in_chunk, mapper, inRawDArgs.fastq, "", ref_data, nb_extracts_per_read) - # if tParms.gpu_mapping_res_dir!=0: - # exit() # Consider that if we put results in files, it is because we are processing large datasets on a cluster. Otherwise, go on working. - # - # if tParms.dir_cov_res!=None and tParms.gpu_mapping_res_dir!=None: # Process the mapping results produced by the GPU and put results in files - # if tParms.idx_chunk==None or tParms.idx_seq==None: - # print "Indicate index of chunk and sequence to process" - # exit(1) - # seq_info = seqInfo(inDArgs.refseq_liste[tParms.idx_seq],tParms.idx_seq, inDArgs.hostseq) - # fname=os.path.join(tParms.gpu_mapping_res_dir,base_fname_rinfo+str(tParms.idx_chunk)) - # d_rinfo=load_d_rinfo(fname) - # readsCoverageGPU_chunk(inRawDArgs.fastq, seq_info, tParms.idx_chunk, d_rinfo, fParms.edge, tParms.limit_coverage, fParms.virome, tParms.gpu_mapping_res_dir, - # tParms.dir_cov_res, logger=None) - # exit() # Consider that if we put results in files, it is because we are processing large datasets on a cluster. if tParms.multi_machine: print("Running on cluster") @@ -111,7 +80,6 @@ def main(): for refseq in inDArgs.refseq_liste[idx_refseq:]: readsCoverage(inRawDArgs, refseq, inDArgs, fParms,None,tParms.core_id, position[tParms.core_id], position[tParms.core_id + 1], tParms,chk_handler,idx_refseq) - print("Processed: ", idx_refseq, " sequences") idx_refseq+=1 if tParms.core_id==0: fname=os.path.join(tParms.dir_cov_mm,"nb_seq_processed.txt") @@ -238,7 +206,7 @@ def main(): # Sequence ExportCohesiveSeq(inRawDArgs.analysis_name, s_stats.ArtcohesiveSeq, s_stats.P_seqcoh, fParms.test_run) - ExportPhageSequence(inRawDArgs.analysis_name, s_stats.P_left, s_stats.P_right, refseq, s_stats.P_orient, s_stats.Redundant, s_stats.Mu_like, \ + ExportPhageSequence(inRawDArgs.analysis_name, s_stats.P_left, s_stats.P_right, RemoveEdge(refseq, fParms.edge), s_stats.P_orient, s_stats.Redundant, s_stats.Mu_like, \ s_stats.P_class, s_stats.P_seqcoh, fParms.test_run) # Report @@ -284,7 +252,7 @@ def main(): idx_refseq=DR[DPC][DC]["idx_refseq_in_list"] refseq=inDArgs.refseq_liste[idx_refseq] multiCohSeq += ExportCohesiveSeq(DC, stat_dict["ArtcohesiveSeq"], stat_dict["P_seqcoh"], fParms.test_run, 1) - multiPhageSeq += ExportPhageSequence(DC, stat_dict["P_left"], stat_dict["P_right"], refseq, stat_dict["P_orient"], stat_dict["Redundant"], stat_dict["Mu_like"], stat_dict["P_class"], stat_dict["P_seqcoh"], fParms.test_run, 1) + multiPhageSeq += ExportPhageSequence(DC, stat_dict["P_left"], stat_dict["P_right"], RemoveEdge(refseq, fParms.edge), stat_dict["P_orient"], stat_dict["Redundant"], stat_dict["Mu_like"], stat_dict["P_class"], stat_dict["P_seqcoh"], fParms.test_run, 1) # Report multiReport = CreateReport(phagename=DC, diff --git a/phagetermvirome/functions_PhageTerm.py b/phagetermvirome/functions_PhageTerm.py index 6c1f6d045fa013b6b53ff881b70fa2b56af11f55..79a11dd17df103a32ed3a69ee5345bb13dc81329 100644 --- a/phagetermvirome/functions_PhageTerm.py +++ b/phagetermvirome/functions_PhageTerm.py @@ -745,6 +745,7 @@ def ExportCohesiveSeq(phagename, ArtcohesiveSeq, P_seqcoh, test_run, multi = 0): filout.close() return "" + def ExportPhageSequence(phagename, P_left, P_right, refseq, P_orient, Redundant, Mu_like, P_class, P_seqcoh, test_run, multi = 0): """Export the phage sequence reorganized and completed if needed.""" if test_run: diff --git a/phagetermvirome/generate_report.py b/phagetermvirome/generate_report.py index c11c92c96d45e7ecdbb55f232b1343f89966c023..d40348849122ea950d7f0fa069703e4fcbfcd45f 100644 --- a/phagetermvirome/generate_report.py +++ b/phagetermvirome/generate_report.py @@ -4,6 +4,7 @@ import pickle from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Image, Table, TableStyle, PageBreak from reportlab.lib.pagesizes import letter, landscape from functions_PhageTerm import SummaryReport,WorkflowReport,ExportCohesiveSeq,ExportPhageSequence,CreateReport +from common_readsCoverage_processing import RemoveEdge def loadDR(DR_path,DR): @@ -109,7 +110,7 @@ def genReport(fParms,inDArgs,inRawDArgs,no_match,DR): idx_refseq = DR[DPC][DC]["idx_refseq_in_list"] refseq = inDArgs.refseq_liste[idx_refseq] multiCohSeq += ExportCohesiveSeq(DC, DR[DPC][DC]["ArtcohesiveSeq"], DR[DPC][DC]["P_seqcoh"], fParms.test_run, 1) - multiPhageSeq += ExportPhageSequence(DC, DR[DPC][DC]["P_left"], DR[DPC][DC]["P_right"], refseq, + multiPhageSeq += ExportPhageSequence(DC, DR[DPC][DC]["P_left"], DR[DPC][DC]["P_right"], RemoveEdge(refseq, fParms.edge), DR[DPC][DC]["P_orient"], DR[DPC][DC]["Redundant"], DR[DPC][DC]["Mu_like"], DR[DPC][DC]["P_class"], DR[DPC][DC]["P_seqcoh"], fParms.test_run, 1) diff --git a/phagetermvirome/main_utils.py b/phagetermvirome/main_utils.py index a888ded9ea2e6e232e7771ae1c57c28626518d43..042d4d0adaafe5c461d2829e3a995ef9bf5f4ef3 100755 --- a/phagetermvirome/main_utils.py +++ b/phagetermvirome/main_utils.py @@ -299,7 +299,6 @@ class InputDerivedDataArgs: def __init__(self,inputRaw,fparms): # REFERENCE sequence recovery and edge adds self.refseq_liste, self.refseq_name, refseq_rejected = genomeFastaRecovery(inputRaw.reference, fparms.limit_reference, fparms.edge) - #print strftime("%a, %d %b %Y %H:%M:%S +0000", gmtime()) self.nbr_virome = len(self.refseq_liste) if self.nbr_virome == 0: print("\nERROR: All the reference(s) sequence(s) are under the length limitation : " + str(