BLASTP 2.2.25+ Reference: Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schäffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402. Reference for composition-based statistics: Alejandro A. Schäffer, L. Aravind, Thomas L. Madden, Sergei Shavirin, John L. Spouge, Yuri I. Wolf, Eugene V. Koonin, and Stephen F. Altschul (2001), "Improving the accuracy of PSI-BLAST protein database searches with composition-based statistics and other refinements", Nucleic Acids Res. 29:2994-3005. Database: All non-redundant GenBank CDS translations+PDB+SwissProt+PIR+PRF excluding environmental samples from WGS projects 15,229,318 sequences; 5,219,829,388 total letters Query= Rv3512 Length=1079 Score E Sequences producing significant alignments: (Bits) Value gi|57117117|ref|YP_177981.1| PE-PGRS family protein [Mycobacteri... 1495 0.0 >gi|57117117|ref|YP_177981.1| PE-PGRS family protein [Mycobacterium tuberculosis H37Rv] gi|7441215|pir||B70807 hypothetical glycine-rich protein Rv3512 - Mycobacterium tuberculosis (strain H37RV) gi|41352798|emb|CAE55606.1| PE-PGRS FAMILY PROTEIN [Mycobacterium tuberculosis H37Rv] Length=1079 Score = 1495 bits (3871), Expect = 0.0, Method: Compositional matrix adjust. Identities = 1079/1079 (100%), Positives = 1079/1079 (100%), Gaps = 0/1079 (0%) Query 1 PQGADGNAGNGGDGGVGGNGGNGADNTTTAAAGTTGGAGGAGGAGGTGGTGGAAGTGTGG 60 PQGADGNAGNGGDGGVGGNGGNGADNTTTAAAGTTGGAGGAGGAGGTGGTGGAAGTGTGG Sbjct 1 PQGADGNAGNGGDGGVGGNGGNGADNTTTAAAGTTGGAGGAGGAGGTGGTGGAAGTGTGG 60 Query 61 QQGNGGNGGNGGTGGKGGTGGDGALAGSSGGAGGKGGNGGDAGKAGTGSAPGTAGTGGDG 120 QQGNGGNGGNGGTGGKGGTGGDGALAGSSGGAGGKGGNGGDAGKAGTGSAPGTAGTGGDG Sbjct 61 QQGNGGNGGNGGTGGKGGTGGDGALAGSSGGAGGKGGNGGDAGKAGTGSAPGTAGTGGDG 120 Query 121 GKGGNGGIGAAGTTGPVGTGASGGTGGSGGAGGTGGDGGAANGGTAGAGGAGGNGGKGGD 180 GKGGNGGIGAAGTTGPVGTGASGGTGGSGGAGGTGGDGGAANGGTAGAGGAGGNGGKGGD Sbjct 121 GKGGNGGIGAAGTTGPVGTGASGGTGGSGGAGGTGGDGGAANGGTAGAGGAGGNGGKGGD 180 Query 181 GGAGVTSSTAGNSGGAGGSGGKGGDAGAGGAGATPGANGIAGNGGDGGDGAAGAVGISGA 240 GGAGVTSSTAGNSGGAGGSGGKGGDAGAGGAGATPGANGIAGNGGDGGDGAAGAVGISGA Sbjct 181 GGAGVTSSTAGNSGGAGGSGGKGGDAGAGGAGATPGANGIAGNGGDGGDGAAGAVGISGA 240 Query 241 TGAGDGGHGGTGAAGGNGGTGGAGGSGIDGVGGGTGGTGGNGGNGAIGGAGGDAGGSGNS 300 TGAGDGGHGGTGAAGGNGGTGGAGGSGIDGVGGGTGGTGGNGGNGAIGGAGGDAGGSGNS Sbjct 241 TGAGDGGHGGTGAAGGNGGTGGAGGSGIDGVGGGTGGTGGNGGNGAIGGAGGDAGGSGNS 300 Query 301 GGNGGIGGKGGNAGAGGAAGSNGGTVGANGTGGDGGNGGAAGAATAGSNGGAGTGSAGGN 360 GGNGGIGGKGGNAGAGGAAGSNGGTVGANGTGGDGGNGGAAGAATAGSNGGAGTGSAGGN Sbjct 301 GGNGGIGGKGGNAGAGGAAGSNGGTVGANGTGGDGGNGGAAGAATAGSNGGAGTGSAGGN 360 Query 361 GGTGGRGGSGGAGGDGIGGVGGGKGGNGADGEVGGAGGAGGSGPNTSPGGNGGQGGQGGS 420 GGTGGRGGSGGAGGDGIGGVGGGKGGNGADGEVGGAGGAGGSGPNTSPGGNGGQGGQGGS Sbjct 361 GGTGGRGGSGGAGGDGIGGVGGGKGGNGADGEVGGAGGAGGSGPNTSPGGNGGQGGQGGS 420 Query 421 GGAGGAAGAGGAGGGANGTAGNGGQGGAGGTGGAGAASSATNGGSGGAGGTGGDGGSGGA 480 GGAGGAAGAGGAGGGANGTAGNGGQGGAGGTGGAGAASSATNGGSGGAGGTGGDGGSGGA Sbjct 421 GGAGGAAGAGGAGGGANGTAGNGGQGGAGGTGGAGAASSATNGGSGGAGGTGGDGGSGGA 480 Query 481 GGTGGAGGTGGAAGDGGQGGQGGAGGGAGGQGGAGGAGGTGGNGGNITGGTAGTAGAAGN 540 GGTGGAGGTGGAAGDGGQGGQGGAGGGAGGQGGAGGAGGTGGNGGNITGGTAGTAGAAGN Sbjct 481 GGTGGAGGTGGAAGDGGQGGQGGAGGGAGGQGGAGGAGGTGGNGGNITGGTAGTAGAAGN 540 Query 541 GGAAGKGGAGGQGGTGGGTGGQGGAGGDGGAGGTGGDRTVGGGTVPAGSGGQGGNAGGGG 600 GGAAGKGGAGGQGGTGGGTGGQGGAGGDGGAGGTGGDRTVGGGTVPAGSGGQGGNAGGGG Sbjct 541 GGAAGKGGAGGQGGTGGGTGGQGGAGGDGGAGGTGGDRTVGGGTVPAGSGGQGGNAGGGG 600 Query 601 AGGQGGADGGSGGDGGDAGTGGNGGNGGNRNSGNGTGGAGGNGGGGANGGAGGAGGSGGG 660 AGGQGGADGGSGGDGGDAGTGGNGGNGGNRNSGNGTGGAGGNGGGGANGGAGGAGGSGGG Sbjct 601 AGGQGGADGGSGGDGGDAGTGGNGGNGGNRNSGNGTGGAGGNGGGGANGGAGGAGGSGGG 660 Query 661 TGGNGGAGGDAGDAGNGGNGNGTGNGGNGGNGGIAGMGGNGGAGTGSGNGGNGGSGGNGG 720 TGGNGGAGGDAGDAGNGGNGNGTGNGGNGGNGGIAGMGGNGGAGTGSGNGGNGGSGGNGG Sbjct 661 TGGNGGAGGDAGDAGNGGNGNGTGNGGNGGNGGIAGMGGNGGAGTGSGNGGNGGSGGNGG 720 Query 721 NAGMGGNSGTGSGDGGAGGNGGAAGTGGTGGDGGLTGTGGTGGSGGTGGDGGNGGNGADN 780 NAGMGGNSGTGSGDGGAGGNGGAAGTGGTGGDGGLTGTGGTGGSGGTGGDGGNGGNGADN Sbjct 721 NAGMGGNSGTGSGDGGAGGNGGAAGTGGTGGDGGLTGTGGTGGSGGTGGDGGNGGNGADN 780 Query 781 TANMTAQAGGDGGNGGDGGFGGGAGAGGGGLTAGANGTGGQGGAGGDGGNGAIGGHGPLT 840 TANMTAQAGGDGGNGGDGGFGGGAGAGGGGLTAGANGTGGQGGAGGDGGNGAIGGHGPLT Sbjct 781 TANMTAQAGGDGGNGGDGGFGGGAGAGGGGLTAGANGTGGQGGAGGDGGNGAIGGHGPLT 840 Query 841 DDPGGNGGTGGNGGTGGTGGAGIGSLGGGTGGDGGNGGNGGTGGEGGEVGGAGGTGGAAG 900 DDPGGNGGTGGNGGTGGTGGAGIGSLGGGTGGDGGNGGNGGTGGEGGEVGGAGGTGGAAG Sbjct 841 DDPGGNGGTGGNGGTGGTGGAGIGSLGGGTGGDGGNGGNGGTGGEGGEVGGAGGTGGAAG 900 Query 901 NGGDGGTGGTGGGDGGAGGTGGTGGTGGLGDPRVGGSGGDGGTGGSGGAAGNGGNGGNAG 960 NGGDGGTGGTGGGDGGAGGTGGTGGTGGLGDPRVGGSGGDGGTGGSGGAAGNGGNGGNAG Sbjct 901 NGGDGGTGGTGGGDGGAGGTGGTGGTGGLGDPRVGGSGGDGGTGGSGGAAGNGGNGGNAG 960 Query 961 AGGNGNGGTGGAGGIGGTGGNGGDAEPGVPPGAGGAGGAGTTGGKGGTGGNGSGTGSGGT 1020 AGGNGNGGTGGAGGIGGTGGNGGDAEPGVPPGAGGAGGAGTTGGKGGTGGNGSGTGSGGT Sbjct 961 AGGNGNGGTGGAGGIGGTGGNGGDAEPGVPPGAGGAGGAGTTGGKGGTGGNGSGTGSGGT 1020 Query 1021 GGDGGTGGGGGNGGTGWNGGKGDTGSGGGAGDGGKAPAGGTGGAGGDGGAGGKGGSGGV 1079 GGDGGTGGGGGNGGTGWNGGKGDTGSGGGAGDGGKAPAGGTGGAGGDGGAGGKGGSGGV Sbjct 1021 GGDGGTGGGGGNGGTGWNGGKGDTGSGGGAGDGGKAPAGGTGGAGGDGGAGGKGGSGGV 1079 Lambda K H 0.301 0.141 0.436 Gapped Lambda K H 0.267 0.0410 0.140 Effective search space used: 2727016038152 Database: All non-redundant GenBank CDS translations+PDB+SwissProt+PIR+PRF excluding environmental samples from WGS projects Posted date: Sep 5, 2011 4:36 AM Number of letters in database: 5,219,829,388 Number of sequences in database: 15,229,318 Matrix: BLOSUM62 Gap Penalties: Existence: 11, Extension: 1 Neighboring words threshold: 11 Window for multiple hits: 40