{
 "cells": [
  {
   "cell_type": "markdown",
   "id": "224b2831",
   "metadata": {},
   "source": [
    "# Genetic diversity, with trees"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "f7376884",
   "metadata": {},
   "source": [
    "Before we measured genetic diversity\n",
    "using expected heterozygosity,\n",
    "which is the proportion of sites that differ between two randomly chosen genomes:\n",
    "for a genome of length $L$, with allele frequency $p_i$ at the $i^\\text{th}$ site, this is:\n",
    "\n",
    "$$\n",
    "  \\pi = \\frac{1}{L}\\sum_{i=1}^L 2 p_i (1-p_i) .\n",
    "$$\n",
    "\n",
    "We'll now derive this in a different way.\n",
    "First, let's think about where the differences between trees come from.\n",
    "As we saw before, they come from mutation, somewhere -\n",
    "concretely, they come from mutations that happened\n",
    "somewhere on the path from the two genomes\n",
    "back up to their common ancestor.\n",
    "(If there weren't any mutations, then they'd be identical;\n",
    "if there's only one mutation, then they differ,\n",
    "and if there was more than one mutation then it depends,\n",
    "but this is rare and we mostly ignore it.)\n",
    "\n",
    "Let's have a look at this in a small example."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "1c8d84e1",
   "metadata": {},
   "outputs": [],
   "source": [
    "%load_ext slim_magic\n",
    "\n",
    "import tskit, pyslim\n",
    "import pandas as pd\n",
    "import numpy as np\n",
    "from matplotlib import pyplot as plt\n",
    "from IPython.display import display, SVG"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "id": "554183e0",
   "metadata": {},
   "outputs": [],
   "source": [
    "%%slim_ts --out ts\n",
    "initialize()\n",
    "{\n",
    "    setSeed(123);\n",
    "    initializeTreeSeq();\n",
    "    initializeMutationRate(7e-8);\n",
    "    initializeMutationType(\"m1\", 0.5, \"f\", 0.0);\n",
    "    initializeGenomicElementType(\"g1\", c(m1), c(1.0));\n",
    "    initializeGenomicElement(g1, 0, 99999);\n",
    "    initializeRecombinationRate(1e-8);\n",
    "    suppressWarnings(T);\n",
    "}\n",
    "\n",
    "1 {\n",
    "    sim.addSubpop(\"p1\", 500);\n",
    "}\n",
    "\n",
    "3000 late() {\n",
    "    sim.treeSeqOutput(\"tmp.trees\");\n",
    "    sim.simulationFinished();\n",
    "}"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "5a56a644",
   "metadata": {},
   "source": [
    "What we get here is a *tree sequence*:\n",
    "see [this tutorial](https://tskit.dev/tutorials/intro.html) for an introduction,\n",
    "and [the documentation](https://tskit.dev/tskit/docs/stable/introduction.html)\n",
    "for what you can do with them."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "719c6633",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "\n",
       "            <div>\n",
       "              <style>\n",
       "                .tskit-table thead tr th {text-align: left;padding: 0.5em 0.5em;}\n",
       "                .tskit-table tbody tr td {padding: 0.5em 0.5em;}\n",
       "                .tskit-table tbody tr td:first-of-type {text-align: left;}\n",
       "                .tskit-details-label {vertical-align: top; padding-right:5px;}\n",
       "                .tskit-table-set {display: inline-flex;flex-wrap: wrap;margin: -12px 0 0 -12px;width: calc(100% + 12px);}\n",
       "                .tskit-table-set-table {margin: 12px 0 0 12px;}\n",
       "                details {display: inline-block;}\n",
       "                summary {cursor: pointer; outline: 0; display: list-item;}\n",
       "              </style>\n",
       "              <div class=\"tskit-table-set\">\n",
       "                <div class=\"tskit-table-set-table\">\n",
       "                  <table class=\"tskit-table\">\n",
       "                    <thead>\n",
       "                      <tr>\n",
       "                        <th style=\"padding:0;line-height:21px;\">\n",
       "                          <img style=\"height: 32px;display: inline-block;padding: 3px 5px 3px 0;\" src=\"https://raw.githubusercontent.com/tskit-dev/administrative/main/tskit_logo.svg\"/>\n",
       "                          <a target=\"_blank\" href=\"https://tskit.dev/tskit/docs/latest/python-api.html#the-treesequence-class\"> Tree Sequence </a>\n",
       "                        </th>\n",
       "                      </tr>\n",
       "                    </thead>\n",
       "                    <tbody>\n",
       "                      <tr><td>Trees</td><td>15</td></tr>\n",
       "                      <tr><td>Sequence Length</td><td>100000.0</td></tr>\n",
       "                      <tr><td>Time Units</td><td>generations</td></tr>\n",
       "                      <tr><td>Sample Nodes</td><td>1000</td></tr>\n",
       "                      <tr><td>Total Size</td><td>208.9 KiB</td></tr>\n",
       "                      <tr>\n",
       "                        <td>Metadata</td><td style=\"text-align: left;\">\n",
       "                <div>\n",
       "                  <span class=\"tskit-details-label\"></span>\n",
       "                  <details open>\n",
       "                    <summary>dict</summary>\n",
       "                    \n",
       "                <div>\n",
       "                  <span class=\"tskit-details-label\">SLiM:</span>\n",
       "                  <details >\n",
       "                    <summary>dict</summary>\n",
       "                    file_version: 0.7<br/>generation: 3000<br/>model_type: WF<br/>nucleotide_based: False<br/>separate_sexes: False<br/>spatial_dimensionality: <br/>spatial_periodicity: <br/>stage: late<br/>\n",
       "                  </details>\n",
       "                </div>\n",
       "                <br/>\n",
       "                  </details>\n",
       "                </div>\n",
       "                </td></tr>\n",
       "                    </tbody>\n",
       "                  </table>\n",
       "                </div>\n",
       "                <div class=\"tskit-table-set-table\">\n",
       "                  <table class=\"tskit-table\">\n",
       "                    <thead>\n",
       "                      <tr>\n",
       "                        <th style=\"line-height:21px;\">Table</th>\n",
       "                        <th>Rows</th>\n",
       "                        <th>Size</th>\n",
       "                        <th>Has Metadata</th>\n",
       "                      </tr>\n",
       "                    </thead>\n",
       "                    <tbody>\n",
       "                    \n",
       "                  <tr>\n",
       "                    <td>Edges</td>\n",
       "                      <td>1855</td>\n",
       "                      <td>58.0 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Individuals</td>\n",
       "                      <td>500</td>\n",
       "                      <td>50.6 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Migrations</td>\n",
       "                      <td>0</td>\n",
       "                      <td>8 Bytes</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Mutations</td>\n",
       "                      <td>129</td>\n",
       "                      <td>8.5 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Nodes</td>\n",
       "                      <td>1818</td>\n",
       "                      <td>68.1 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Populations</td>\n",
       "                      <td>2</td>\n",
       "                      <td>2.4 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Provenances</td>\n",
       "                      <td>1</td>\n",
       "                      <td>2.1 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Sites</td>\n",
       "                      <td>129</td>\n",
       "                      <td>3.0 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                    </tbody>\n",
       "                  </table>\n",
       "                </div>\n",
       "              </div>\n",
       "            </div>\n",
       "            "
      ],
      "text/plain": [
       "<tskit.trees.TreeSequence at 0x7fc0345baa00>"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "ts"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "77eaf4f3",
   "metadata": {},
   "source": [
    "Let's suppose we take a sample of just 3 diploids from this population,\n",
    "so we can easily look at their genealogies and genotypes.\n",
    "We can do this with the `simplify( )` method:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "id": "f2c99755",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "\n",
       "            <div>\n",
       "              <style>\n",
       "                .tskit-table thead tr th {text-align: left;padding: 0.5em 0.5em;}\n",
       "                .tskit-table tbody tr td {padding: 0.5em 0.5em;}\n",
       "                .tskit-table tbody tr td:first-of-type {text-align: left;}\n",
       "                .tskit-details-label {vertical-align: top; padding-right:5px;}\n",
       "                .tskit-table-set {display: inline-flex;flex-wrap: wrap;margin: -12px 0 0 -12px;width: calc(100% + 12px);}\n",
       "                .tskit-table-set-table {margin: 12px 0 0 12px;}\n",
       "                details {display: inline-block;}\n",
       "                summary {cursor: pointer; outline: 0; display: list-item;}\n",
       "              </style>\n",
       "              <div class=\"tskit-table-set\">\n",
       "                <div class=\"tskit-table-set-table\">\n",
       "                  <table class=\"tskit-table\">\n",
       "                    <thead>\n",
       "                      <tr>\n",
       "                        <th style=\"padding:0;line-height:21px;\">\n",
       "                          <img style=\"height: 32px;display: inline-block;padding: 3px 5px 3px 0;\" src=\"https://raw.githubusercontent.com/tskit-dev/administrative/main/tskit_logo.svg\"/>\n",
       "                          <a target=\"_blank\" href=\"https://tskit.dev/tskit/docs/latest/python-api.html#the-treesequence-class\"> Tree Sequence </a>\n",
       "                        </th>\n",
       "                      </tr>\n",
       "                    </thead>\n",
       "                    <tbody>\n",
       "                      <tr><td>Trees</td><td>6</td></tr>\n",
       "                      <tr><td>Sequence Length</td><td>100000.0</td></tr>\n",
       "                      <tr><td>Time Units</td><td>generations</td></tr>\n",
       "                      <tr><td>Sample Nodes</td><td>6</td></tr>\n",
       "                      <tr><td>Total Size</td><td>112.7 KiB</td></tr>\n",
       "                      <tr>\n",
       "                        <td>Metadata</td><td style=\"text-align: left;\">\n",
       "                <div>\n",
       "                  <span class=\"tskit-details-label\"></span>\n",
       "                  <details open>\n",
       "                    <summary>dict</summary>\n",
       "                    \n",
       "                <div>\n",
       "                  <span class=\"tskit-details-label\">SLiM:</span>\n",
       "                  <details >\n",
       "                    <summary>dict</summary>\n",
       "                    file_version: 0.7<br/>generation: 3000<br/>model_type: WF<br/>nucleotide_based: False<br/>separate_sexes: False<br/>spatial_dimensionality: <br/>spatial_periodicity: <br/>stage: late<br/>\n",
       "                  </details>\n",
       "                </div>\n",
       "                <br/>\n",
       "                  </details>\n",
       "                </div>\n",
       "                </td></tr>\n",
       "                    </tbody>\n",
       "                  </table>\n",
       "                </div>\n",
       "                <div class=\"tskit-table-set-table\">\n",
       "                  <table class=\"tskit-table\">\n",
       "                    <thead>\n",
       "                      <tr>\n",
       "                        <th style=\"line-height:21px;\">Table</th>\n",
       "                        <th>Rows</th>\n",
       "                        <th>Size</th>\n",
       "                        <th>Has Metadata</th>\n",
       "                      </tr>\n",
       "                    </thead>\n",
       "                    <tbody>\n",
       "                    \n",
       "                  <tr>\n",
       "                    <td>Edges</td>\n",
       "                      <td>25</td>\n",
       "                      <td>808 Bytes</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Individuals</td>\n",
       "                      <td>3</td>\n",
       "                      <td>2.1 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Migrations</td>\n",
       "                      <td>0</td>\n",
       "                      <td>8 Bytes</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Mutations</td>\n",
       "                      <td>39</td>\n",
       "                      <td>3.3 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Nodes</td>\n",
       "                      <td>14</td>\n",
       "                      <td>1.2 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Populations</td>\n",
       "                      <td>1</td>\n",
       "                      <td>2.3 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        ✅\n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Provenances</td>\n",
       "                      <td>2</td>\n",
       "                      <td>2.5 KiB</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                  <tr>\n",
       "                    <td>Sites</td>\n",
       "                      <td>39</td>\n",
       "                      <td>991 Bytes</td>\n",
       "                      <td style=\"text-align: center;\">\n",
       "                        \n",
       "                      </td>\n",
       "                    </tr>\n",
       "                \n",
       "                    </tbody>\n",
       "                  </table>\n",
       "                </div>\n",
       "              </div>\n",
       "            </div>\n",
       "            "
      ],
      "text/plain": [
       "<pyslim.slim_tree_sequence.SlimTreeSequence at 0x7fbfea35e820>"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "sts = ts.simplify(range(6))\n",
    "sts = pyslim.generate_nucleotides(sts)\n",
    "sts = pyslim.convert_alleles(sts)\n",
    "sts"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "id": "cc0d5f9b",
   "metadata": {
    "scrolled": false
   },
   "outputs": [
    {
     "data": {
      "image/svg+xml": [
       "<svg xmlns=\"http://www.w3.org/2000/svg\" xmlns:ev=\"http://www.w3.org/2001/xml-events\" xmlns:xlink=\"http://www.w3.org/1999/xlink\" baseProfile=\"full\" height=\"400\" version=\"1.1\" width=\"1000\"><defs><style type=\"text/css\"><![CDATA[.background path {fill: #808080; fill-opacity: 0}.background path:nth-child(odd) {fill-opacity: .1}.axes {font-size: 14px}.x-axis .tick .lab {font-weight: bold; dominant-baseline: hanging}.axes, .tree {font-size: 14px; text-anchor: middle}.axes line, .edge {stroke: black; fill: none}.y-axis .grid {stroke: #FAFAFA}.node > .sym {fill: black; stroke: none}.site > .sym {stroke: black}.mut text {fill: red; font-style: italic}.mut.extra text {fill: hotpink}.mut line {fill: none; stroke: none}.mut .sym {fill: none; stroke: red}.mut.extra .sym {stroke: hotpink}.node .mut .sym {stroke-width: 1.5px}.tree text, .tree-sequence text {dominant-baseline: central}.plotbox .lab.lft {text-anchor: end}.plotbox .lab.rgt {text-anchor: start}]]></style></defs><g class=\"tree-sequence\"><g class=\"background\"><path d=\"M20,0 l160,0 l0,338.2 l248.845,25 l0,5 l-408.845,0 l0,-5 l0,-25 l0,-338.2z\"/><path d=\"M180,0 l160,0 l0,338.2 l140.464,25 l0,5 l-51.6192,0 l0,-5 l-248.845,-25 l0,-338.2z\"/><path d=\"M340,0 l160,0 l0,338.2 l103.181,25 l0,5 l-122.717,0 l0,-5 l-140.464,-25 l0,-338.2z\"/><path d=\"M500,0 l160,0 l0,338.2 l74.7008,25 l0,5 l-131.52,0 l0,-5 l-103.181,-25 l0,-338.2z\"/><path d=\"M660,0 l160,0 l0,338.2 l128.128,25 l0,5 l-213.427,0 l0,-5 l-74.7008,-25 l0,-338.2z\"/><path d=\"M820,0 l160,0 l0,338.2 l0,25 l0,5 l-31.872,0 l0,-5 l-128.128,-25 l0,-338.2z\"/></g><g class=\"axes\"><g class=\"x-axis\"><g transform=\"translate(500 400)\"><text class=\"lab\" text-anchor=\"middle\" transform=\"translate(0 -11)\">Genome position</text></g><line x1=\"20\" x2=\"980\" y1=\"363.2\" y2=\"363.2\"/><g class=\"ticks\"><g class=\"tick\" transform=\"translate(20 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">0</text></g></g><g class=\"tick\" transform=\"translate(428.845 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">42588</text></g></g><g class=\"tick\" transform=\"translate(480.464 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">47965</text></g></g><g class=\"tick\" transform=\"translate(603.181 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">60748</text></g></g><g class=\"tick\" transform=\"translate(734.701 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">74448</text></g></g><g class=\"tick\" transform=\"translate(948.128 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">96680</text></g></g><g class=\"tick\" transform=\"translate(980 363.2)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5\"/><g transform=\"translate(0 6)\"><text class=\"lab\">100000</text></g></g></g><g class=\"site s0\" transform=\"translate(24.9536 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m0\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s1\" transform=\"translate(99.9296 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m1\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s2\" transform=\"translate(102.128 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m2\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s3\" transform=\"translate(103.059 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m3\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s4\" transform=\"translate(107.571 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m4\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s5\" transform=\"translate(113.6 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m5\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s6\" transform=\"translate(115.885 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m6\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s7\" transform=\"translate(120.032 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m7\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s8\" transform=\"translate(179.418 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m8\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s9\" transform=\"translate(197.466 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m9\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s10\" transform=\"translate(204.522 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m10\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s11\" transform=\"translate(208.582 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m11\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s12\" transform=\"translate(222.445 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m12\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s13\" transform=\"translate(223.587 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m13\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s14\" transform=\"translate(325.616 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m14\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s15\" transform=\"translate(405.92 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m15\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s16\" transform=\"translate(450.79 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m16\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s17\" transform=\"translate(468.589 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m17\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s18\" transform=\"translate(483.949 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m18\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s19\" transform=\"translate(493.309 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m19\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s20\" transform=\"translate(530.278 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m20\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s21\" transform=\"translate(600.877 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m21\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s22\" transform=\"translate(634.227 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m22\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s23\" transform=\"translate(652.275 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m23\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s24\" transform=\"translate(656.662 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m24\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s25\" transform=\"translate(665.043 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m25\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s26\" transform=\"translate(684.829 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m26\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s27\" transform=\"translate(691.184 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m27\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s28\" transform=\"translate(713.149 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m28\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s29\" transform=\"translate(755.696 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m29\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s30\" transform=\"translate(757.53 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m30\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s31\" transform=\"translate(772.89 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m31\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s32\" transform=\"translate(812.365 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m32\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s33\" transform=\"translate(885.19 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m33\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s34\" transform=\"translate(887.466 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m34\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s35\" transform=\"translate(915.037 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m35\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s36\" transform=\"translate(946.17 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m36\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s37\" transform=\"translate(951.834 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m37\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g><g class=\"site s38\" transform=\"translate(969.248 363.2)\"><line class=\"sym\" x1=\"0\" x2=\"0\" y1=\"0\" y2=\"-10\"/><g class=\"mut m38\"><polyline class=\"sym\" points=\"2.5,-6.5 0,-1.5 -2.5,-6.5\"/></g></g></g></g><g class=\"plotbox trees\"><g class=\"tree t0\" transform=\"translate(20 0)\"><g class=\"plotbox\"><g class=\"c2 m0 m11 m12 m15 m2 m3 m4 m5 node n13 p0 root s0 s11 s12 s15 s2 s3 s4 s5\" transform=\"translate(85 246.141)\"><g class=\"a13 c2 m14 m9 node n11 p0 s14 s9\" transform=\"translate(-30 6.80243)\"><g class=\"a11 i2 leaf node n4 p0 sample\" transform=\"translate(15 68.4562)\"><path class=\"edge\" d=\"M 0 0 V -68.4562 H -15\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">4</text></g><g class=\"a11 c2 m6 m7 node n6 p0 s6 s7\" transform=\"translate(-15 47.1851)\"><g class=\"a6 i0 leaf node n0 p0 sample\" transform=\"translate(-10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">0</text></g><g class=\"a6 i0 leaf m13 node n1 p0 s13 sample\" transform=\"translate(10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H -10\"/><g class=\"mut m13 s13\" transform=\"translate(0 -1.07975)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"1.07975\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">13</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">1</text></g><path class=\"edge\" d=\"M 0 0 V -47.1851 H 15\"/><g class=\"mut m7 s7\" transform=\"translate(0 -23.3226)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"23.3226\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">7</text></g><g class=\"mut m6 s6\" transform=\"translate(0 -4.64293)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"4.64293\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">6</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">6</text></g><path class=\"edge\" d=\"M 0 0 V -6.80243 H 30\"/><g class=\"mut m9 s9\" transform=\"translate(0 -2.26748)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"2.26748\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">9</text></g><g class=\"mut m14 s14\" transform=\"translate(0 -0.21595)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"0.21595\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">14</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">11</text></g><g class=\"a13 c2 node n12 p0\" transform=\"translate(30 3.23925)\"><g class=\"a12 i1 leaf m8 node n3 p0 s8 sample\" transform=\"translate(15 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H -15\"/><g class=\"mut m8 s8\" transform=\"translate(0 -26.2379)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"26.2379\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">8</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">3</text></g><g class=\"a12 c2 node n10 p0\" transform=\"translate(-15 18.4637)\"><g class=\"a10 i1 leaf node n2 p0 sample\" transform=\"translate(-10 53.5556)\"><path class=\"edge\" d=\"M 0 0 V -53.5556 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">2</text></g><g class=\"a10 i2 leaf m1 m10 node n5 p0 s1 s10 sample\" transform=\"translate(10 53.5556)\"><path class=\"edge\" d=\"M 0 0 V -53.5556 H -10\"/><g class=\"mut m10 s10\" transform=\"translate(0 -10.4736)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"10.4736\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">10</text></g><g class=\"mut m1 s1\" transform=\"translate(0 -5.39875)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"5.39875\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">1</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">5</text></g><path class=\"edge\" d=\"M 0 0 V -18.4637 H 15\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">10</text></g><path class=\"edge\" d=\"M 0 0 V -3.23925 H -30\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">12</text></g><path class=\"edge\" d=\"M 0 0 V -193.059 H 0\"/><g class=\"mut m5 s5\" transform=\"translate(0 -193.059)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"193.059\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">5</text></g><g class=\"mut m3 s3\" transform=\"translate(0 -187.229)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"187.229\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">3</text></g><g class=\"mut m4 s4\" transform=\"translate(0 -180.966)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"180.966\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">4</text></g><g class=\"mut m11 s11\" transform=\"translate(0 -108.839)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"108.839\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">11</text></g><g class=\"mut m2 s2\" transform=\"translate(0 -102.144)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"102.144\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">2</text></g><g class=\"mut m0 s0\" transform=\"translate(0 -79.5776)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"79.5776\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">0</text></g><g class=\"mut m15 s15\" transform=\"translate(0 -51.0722)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"51.0722\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">15</text></g><g class=\"mut m12 s12\" transform=\"translate(0 -20.5153)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"20.5153\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">12</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">13</text></g></g></g><g class=\"tree t1\" transform=\"translate(180 0)\"><g class=\"plotbox\"><g class=\"c2 m17 node n13 p0 root s17\" transform=\"translate(96.25 246.141)\"><g class=\"a13 c2 node n11 p0\" transform=\"translate(-23.75 6.80243)\"><g class=\"a11 i2 leaf node n4 p0 sample\" transform=\"translate(17.5 68.4562)\"><path class=\"edge\" d=\"M 0 0 V -68.4562 H -17.5\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">4</text></g><g class=\"a11 c2 m16 node n8 p0 s16\" transform=\"translate(-17.5 18.1398)\"><g class=\"a8 i2 leaf node n5 p0 sample\" transform=\"translate(15 50.3164)\"><path class=\"edge\" d=\"M 0 0 V -50.3164 H -15\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">5</text></g><g class=\"a8 c2 node n6 p0\" transform=\"translate(-15 29.0453)\"><g class=\"a6 i0 leaf node n0 p0 sample\" transform=\"translate(-10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">0</text></g><g class=\"a6 i0 leaf node n1 p0 sample\" transform=\"translate(10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">1</text></g><path class=\"edge\" d=\"M 0 0 V -29.0453 H 15\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">6</text></g><path class=\"edge\" d=\"M 0 0 V -18.1398 H 17.5\"/><g class=\"mut m16 s16\" transform=\"translate(0 -4.21103)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"4.21103\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">16</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">8</text></g><path class=\"edge\" d=\"M 0 0 V -6.80243 H 23.75\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">11</text></g><g class=\"a13 c2 node n12 p0\" transform=\"translate(23.75 3.23925)\"><g class=\"a12 i1 leaf node n3 p0 sample\" transform=\"translate(10 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">3</text></g><g class=\"a12 i1 leaf node n2 p0 sample\" transform=\"translate(-10 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">2</text></g><path class=\"edge\" d=\"M 0 0 V -3.23925 H -23.75\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">12</text></g><path class=\"edge\" d=\"M 0 0 V -70.1838 H 0\"/><g class=\"mut m17 s17\" transform=\"translate(0 -70.1838)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"70.1838\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">17</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">13</text></g></g></g><g class=\"tree t2\" transform=\"translate(340 0)\"><g class=\"plotbox\"><g class=\"c2 m19 node n13 p0 root s19\" transform=\"translate(96.25 246.141)\"><g class=\"a13 c2 node n11 p0\" transform=\"translate(-23.75 6.80243)\"><g class=\"a11 i2 leaf node n4 p0 sample\" transform=\"translate(17.5 68.4562)\"><path class=\"edge\" d=\"M 0 0 V -68.4562 H -17.5\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">4</text></g><g class=\"a11 c2 node n9 p0\" transform=\"translate(-17.5 15.1165)\"><g class=\"a9 i0 leaf node n1 p0 sample\" transform=\"translate(15 53.3397)\"><path class=\"edge\" d=\"M 0 0 V -53.3397 H -15\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">1</text></g><g class=\"a9 c2 node n8 p0\" transform=\"translate(-15 3.0233)\"><g class=\"a8 i2 leaf node n5 p0 sample\" transform=\"translate(10 50.3164)\"><path class=\"edge\" d=\"M 0 0 V -50.3164 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">5</text></g><g class=\"a8 i0 leaf node n0 p0 sample\" transform=\"translate(-10 50.3164)\"><path class=\"edge\" d=\"M 0 0 V -50.3164 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">0</text></g><path class=\"edge\" d=\"M 0 0 V -3.0233 H 15\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">8</text></g><path class=\"edge\" d=\"M 0 0 V -15.1165 H 17.5\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">9</text></g><path class=\"edge\" d=\"M 0 0 V -6.80243 H 23.75\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">11</text></g><g class=\"a13 c2 node n12 p0\" transform=\"translate(23.75 3.23925)\"><g class=\"a12 i1 leaf m18 m20 m21 node n3 p0 s18 s20 s21 sample\" transform=\"translate(10 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H -10\"/><g class=\"mut m21 s21\" transform=\"translate(0 -35.3078)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"35.3078\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">21</text></g><g class=\"mut m20 s20\" transform=\"translate(0 -27.4257)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"27.4257\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">20</text></g><g class=\"mut m18 s18\" transform=\"translate(0 -25.2662)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"25.2662\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">18</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">3</text></g><g class=\"a12 i1 leaf node n2 p0 sample\" transform=\"translate(-10 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">2</text></g><path class=\"edge\" d=\"M 0 0 V -3.23925 H -23.75\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">12</text></g><path class=\"edge\" d=\"M 0 0 V -184.529 H 0\"/><g class=\"mut m19 s19\" transform=\"translate(0 -184.529)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"184.529\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">19</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">13</text></g></g></g><g class=\"tree t3\" transform=\"translate(500 0)\"><g class=\"plotbox\"><g class=\"c2 m22 m23 m28 node n13 p0 root s22 s23 s28\" transform=\"translate(96.25 246.141)\"><g class=\"a13 c2 node n11 p0\" transform=\"translate(-23.75 6.80243)\"><g class=\"a11 i2 leaf node n4 p0 sample\" transform=\"translate(17.5 68.4562)\"><path class=\"edge\" d=\"M 0 0 V -68.4562 H -17.5\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">4</text></g><g class=\"a11 c2 node n9 p0\" transform=\"translate(-17.5 15.1165)\"><g class=\"a9 i0 leaf m24 node n1 p0 s24 sample\" transform=\"translate(15 53.3397)\"><path class=\"edge\" d=\"M 0 0 V -53.3397 H -15\"/><g class=\"mut m24 s24\" transform=\"translate(0 -29.8011)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"29.8011\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">24</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">1</text></g><g class=\"a9 c2 m27 node n6 p0 s27\" transform=\"translate(-15 32.0686)\"><g class=\"a6 i0 leaf m25 node n0 p0 s25 sample\" transform=\"translate(-10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H 10\"/><g class=\"mut m25 s25\" transform=\"translate(0 -15.9803)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"15.9803\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">25</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">0</text></g><g class=\"a6 i2 leaf node n5 p0 sample\" transform=\"translate(10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">5</text></g><path class=\"edge\" d=\"M 0 0 V -32.0686 H 15\"/><g class=\"mut m27 s27\" transform=\"translate(0 -10.5816)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"10.5816\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">27</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">6</text></g><path class=\"edge\" d=\"M 0 0 V -15.1165 H 17.5\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">9</text></g><path class=\"edge\" d=\"M 0 0 V -6.80243 H 23.75\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">11</text></g><g class=\"a13 c2 node n12 p0\" transform=\"translate(23.75 3.23925)\"><g class=\"a12 i1 leaf node n3 p0 sample\" transform=\"translate(10 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">3</text></g><g class=\"a12 i1 leaf m26 node n2 p0 s26 sample\" transform=\"translate(-10 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H 10\"/><g class=\"mut m26 s26\" transform=\"translate(0 -68.0243)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"68.0243\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">26</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">2</text></g><path class=\"edge\" d=\"M 0 0 V -3.23925 H -23.75\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">12</text></g><path class=\"edge\" d=\"M 0 0 V -236.141 H 0\"/><g class=\"mut m28 s28\" transform=\"translate(0 -236.141)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"236.141\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">28</text></g><g class=\"mut m23 s23\" transform=\"translate(0 -73.7469)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"73.7469\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">23</text></g><g class=\"mut m22 s22\" transform=\"translate(0 -56.147)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"56.147\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">22</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">13</text></g></g></g><g class=\"tree t4\" transform=\"translate(660 0)\"><g class=\"plotbox\"><g class=\"c2 m29 m36 node n13 p0 root s29 s36\" transform=\"translate(85 246.141)\"><g class=\"a13 c2 node n11 p0\" transform=\"translate(-30 6.80243)\"><g class=\"a11 i2 leaf m32 m34 m35 node n4 p0 s32 s34 s35 sample\" transform=\"translate(15 68.4562)\"><path class=\"edge\" d=\"M 0 0 V -68.4562 H -15\"/><g class=\"mut m32 s32\" transform=\"translate(0 -41.7863)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"41.7863\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">32</text></g><g class=\"mut m34 s34\" transform=\"translate(0 -26.9938)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"26.9938\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">34</text></g><g class=\"mut m35 s35\" transform=\"translate(0 -11.3374)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"11.3374\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">35</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">4</text></g><g class=\"a11 c2 node n6 p0\" transform=\"translate(-15 47.1851)\"><g class=\"a6 i0 leaf node n0 p0 sample\" transform=\"translate(-10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">0</text></g><g class=\"a6 i2 leaf node n5 p0 sample\" transform=\"translate(10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">5</text></g><path class=\"edge\" d=\"M 0 0 V -47.1851 H 15\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">6</text></g><path class=\"edge\" d=\"M 0 0 V -6.80243 H 30\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">11</text></g><g class=\"a13 c2 node n12 p0\" transform=\"translate(30 3.23925)\"><g class=\"a12 i1 leaf node n3 p0 sample\" transform=\"translate(15 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H -15\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">3</text></g><g class=\"a12 c2 m33 node n7 p0 s33\" transform=\"translate(-15 34.0121)\"><g class=\"a7 i0 leaf m30 m31 node n1 p0 s30 s31 sample\" transform=\"translate(-10 38.0072)\"><path class=\"edge\" d=\"M 0 0 V -38.0072 H 10\"/><g class=\"mut m30 s30\" transform=\"translate(0 -35.6318)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"35.6318\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">30</text></g><g class=\"mut m31 s31\" transform=\"translate(0 -9.39383)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"9.39383\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">31</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">1</text></g><g class=\"a7 i1 leaf node n2 p0 sample\" transform=\"translate(10 38.0072)\"><path class=\"edge\" d=\"M 0 0 V -38.0072 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">2</text></g><path class=\"edge\" d=\"M 0 0 V -34.0121 H 15\"/><g class=\"mut m33 s33\" transform=\"translate(0 -15.9803)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"15.9803\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">33</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">7</text></g><path class=\"edge\" d=\"M 0 0 V -3.23925 H -30\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">12</text></g><path class=\"edge\" d=\"M 0 0 V -58.5225 H 0\"/><g class=\"mut m36 s36\" transform=\"translate(0 -58.5225)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"58.5225\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">36</text></g><g class=\"mut m29 s29\" transform=\"translate(0 -53.2317)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"53.2317\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">29</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">13</text></g></g></g><g class=\"tree t5\" transform=\"translate(820 0)\"><g class=\"plotbox\"><g class=\"c2 m37 node n12 p0 root s37\" transform=\"translate(55 249.381)\"><g class=\"a12 i1 leaf node n3 p0 sample\" transform=\"translate(15 72.0193)\"><path class=\"edge\" d=\"M 0 0 V -72.0193 H -15\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">3</text></g><g class=\"a12 c2 node n7 p0\" transform=\"translate(-15 34.0121)\"><g class=\"a7 i0 leaf node n1 p0 sample\" transform=\"translate(-10 38.0072)\"><path class=\"edge\" d=\"M 0 0 V -38.0072 H 10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">1</text></g><g class=\"a7 i1 leaf node n2 p0 sample\" transform=\"translate(10 38.0072)\"><path class=\"edge\" d=\"M 0 0 V -38.0072 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">2</text></g><path class=\"edge\" d=\"M 0 0 V -34.0121 H 15\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">7</text></g><path class=\"edge\" d=\"M 0 0 V -196.407 H 0\"/><g class=\"mut m37 s37\" transform=\"translate(0 -196.407)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"196.407\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab rgt\" transform=\"translate(5 0)\">37</text></g><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">12</text></g><g class=\"c2 node n11 p0 root\" transform=\"translate(115 252.944)\"><g class=\"a11 i2 leaf node n4 p0 sample\" transform=\"translate(15 68.4562)\"><path class=\"edge\" d=\"M 0 0 V -68.4562 H -15\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">4</text></g><g class=\"a11 c2 node n6 p0\" transform=\"translate(-15 47.1851)\"><g class=\"a6 i0 leaf m38 node n0 p0 s38 sample\" transform=\"translate(-10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H 10\"/><g class=\"mut m38 s38\" transform=\"translate(0 -14.4687)\"><line x1=\"0\" x2=\"0\" y1=\"0\" y2=\"14.4687\"/><path class=\"sym\" d=\"M -3,-3 l 6,6 M -3,3 l 6,-6\"/><text class=\"lab lft\" transform=\"translate(-5 0)\">38</text></g><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">0</text></g><g class=\"a6 i2 leaf node n5 p0 sample\" transform=\"translate(10 21.2711)\"><path class=\"edge\" d=\"M 0 0 V -21.2711 H -10\"/><rect class=\"sym\" height=\"6\" width=\"6\" x=\"-3\" y=\"-3\"/><text class=\"lab\" transform=\"translate(0 11)\">5</text></g><path class=\"edge\" d=\"M 0 0 V -47.1851 H 15\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab lft\" transform=\"translate(-3 -7.0)\">6</text></g><path class=\"edge\" d=\"M 0 0 V -38.925 H 0\"/><circle class=\"sym\" cx=\"0\" cy=\"0\" r=\"3\"/><text class=\"lab rgt\" transform=\"translate(3 -7.0)\">11</text></g></g></g></g></g></svg>"
      ],
      "text/plain": [
       "<IPython.core.display.SVG object>"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "SVG(sts.draw_svg(size=(1000, 400)))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "351ae6cb",
   "metadata": {},
   "source": [
    "There are 38 sites (out of 100kb) at which we have mutations.\n",
    "Some of these (shown on the roots of the trees above) are fixed in this sample,\n",
    "i.e., don't differ between these six genomes.\n",
    "\n",
    "Now, let's look at the six genotypes at these 38 sites:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "id": "88370e91",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "sample 0:  GCCGTGAAACGCGTCCTAAAACTGGACCGAGGCAGGGAG\n",
      "sample 1:  GCCGTGAAACGCGACCTAAAACTGTGCAGATACGGGGCA\n",
      "sample 2:  GCCGTGTTATGCGTTCCAAAACTGGGGAGAGGCGGGGCA\n",
      "sample 3:  GCCGTGTTCTGCGTTCCATAGGTGGGCAGAGGCAGGGCA\n",
      "sample 4:  GCCGTGTTACGCGTCCCAAAACTGGGCAGAGGAACCGAA\n",
      "sample 5:  GGCGTGTTATCCGTTCTAAAACTGGGCCGAGGCAGGGAA\n"
     ]
    }
   ],
   "source": [
    "for i, h in enumerate(sts.haplotypes()):\n",
    "    print(f\"sample {i}: \", h)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "id": "99156b1d",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Expected heterozygosity in the subsample is 9.9e-05, while in the entire population it was 0.00012.\n"
     ]
    }
   ],
   "source": [
    "print(f\"Expected heterozygosity in the subsample is {sts.diversity():.2g}, \"\n",
    "      f\"while in the entire population it was {ts.diversity():.2g}.\")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "3b00c326",
   "metadata": {},
   "source": [
    "**Exercise:**\n",
    "Compute heterozygosity in this subsample by hand\n",
    "by looking at the genotypes above.\n",
    "(*Hint:* sum up $2p_i(1-p_i)$ and divide by the genome length.)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "24b1c7ad",
   "metadata": {},
   "source": [
    "## Drift-mutation balance, again"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "f4300f01",
   "metadata": {},
   "source": [
    "Let's derive the expression we got for equilibrium genetic diversity\n",
    "again, but this time looking at the trees.\n",
    "We want to know *what's the probability that two genomes differ at a given site?*\n",
    "Well, suppose the two genomes live at the same time (call it \"today\"),\n",
    "and their most recent common ancestor lived $T$ generations ago.\n",
    "So, there were $2T$ reproduction events during which a mutation would have been inherited by\n",
    "one and not the other of the genomes.\n",
    "Let's use a different simplified mutation model this time:\n",
    "the *infinite sites* model,\n",
    "assuming that we can count up *all* mutations that differ between the two genomes.\n",
    "(This differs from the previous model, where two mutations could cancel each other out.)\n",
    "Afterwards, we can see how much of an effect the unrealistic parts\n",
    "of this model might have.\n",
    "\n",
    "The number of mutations, $M$, has a Binomial distribution\n",
    "with sample size $2T$ and probability $\\mu$,\n",
    "so the expected number of mutations per site\n",
    "(i.e., the heterozygosity) is\n",
    "\n",
    "$$\\begin{aligned}\n",
    "   \\pi = \\mathbb{E}\\left[ 2 T \\mu \\right] .\n",
    "\\end{aligned}$$\n",
    "\n",
    "So, what is $\\mathbb{E}[T]$?\n",
    "Well, under the Wright-Fisher model,\n",
    "the probability that two genomes find their common ancestor each generation is $1/2N$,\n",
    "and so\n",
    "\n",
    "$$\n",
    "   \\mathbb{P}\\left\\{ T > t \\right\\} = (1 - 1/2N)^t .\n",
    "$$\n",
    "\n",
    "This is the Geometric distribution,\n",
    "and has mean $\\mathbb{E}[T] = 2N$.\n",
    "This implies that, precisely under this model of mutation,\n",
    "\n",
    "$$\n",
    "   \\pi = 4 N \\mu .\n",
    "$$\n",
    "\n",
    "This agrees with our previous calculation!\n",
    "The advantage to this one is that it brings the trees into focus:\n",
    "we see that heterozygosity\n",
    "is equal, on average, to $4 \\mu$ times the mean time to most recent common ancestor.\n",
    "This fact is much more general than the Wright-Fisher model.\n",
    "\n",
    "And, along the way, we've learned that the mean pairwise time to most recent common ancestor\n",
    "in a Wright-Fisher population of size $N$ is $2N$ generations.\n",
    "This is very useful!\n"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.9"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}