etherpump/etherpump/commands/publication.py

import json
import os
import re
import sys
import time
from argparse import ArgumentParser
from datetime import datetime
from time import sleep
from urllib.parse import quote, urlencode, urlparse, urlunparse
from urllib.request import HTTPError, URLError, urlopen

from jinja2 import Environment, FileSystemLoader

import dateutil.parser
import pypandoc
from etherpump.commands.common import *


"""
publication:
    Generate a single document from etherpumps using a template.

    Built-in templates: publication.html

"""


def group(items, key=lambda x: x):
    """ returns a list of lists, of items grouped by a key function """
    ret = []
    keys = {}
    for item in items:
        k = key(item)
        if k not in keys:
            keys[k] = []
        keys[k].append(item)
    for k in sorted(keys):
        keys[k].sort()
        ret.append(keys[k])
    return ret


# def base (x):
#     return re.sub(r"(\.raw\.html)|(\.diff\.html)|(\.meta\.json)|(\.raw\.txt)$", "", x)


def splitextlong(x):
    """ split "long" extensions, i.e. foo.bar.baz => ('foo', '.bar.baz') """
    m = re.search(r"^(.*?)(\..*)$", x)
    if m:
        return m.groups()
    else:
        return x, ''


def base(x):
    return splitextlong(x)[0]


def excerpt(t, chars=25):
    if len(t) > chars:
        t = t[:chars] + "..."
    return t


def absurl(url, base=None):
    if not url.startswith("http"):
        return base + url
    return url


def url_base(url):
    (scheme, netloc, path, params, query, fragment) = urlparse(url)
    path, _ = os.path.split(path.lstrip("/"))
    ret = urlunparse((scheme, netloc, path, None, None, None))
    if ret:
        ret += "/"
    return ret


def datetimeformat(t, format='%Y-%m-%d %H:%M:%S'):
    if type(t) == str:
        dt = dateutil.parser.parse(t)
        return dt.strftime(format)
    else:
        return time.strftime(format, time.localtime(t))


def main(args):
    p = ArgumentParser("Convert dumped files to a document via a template.")

    p.add_argument("input", nargs="+", help="Files to list (.meta.json files)")

    p.add_argument(
        "--templatepath",
        default=None,
        help="path to find templates, default: built-in",
    )
    p.add_argument(
        "--template",
        default="publication.html",
        help="template name, built-ins include publication.html; default: publication.html",
    )
    p.add_argument(
        "--padinfo",
        default=".etherpump/settings.json",
        help="settings, default: ./.etherdump/settings.json",
    )
    # p.add_argument("--zerorevs", default=False, action="store_true", help="include pads with zero revisions, default: False (i.e. pads with no revisions are skipped)")

    p.add_argument(
        "--order",
        default="padid",
        help="order, possible values: padid, pad (no group name), lastedited, (number of) authors, revisions, default: padid",
    )
    p.add_argument(
        "--reverse",
        default=False,
        action="store_true",
        help="reverse order, default: False (reverse chrono)",
    )
    p.add_argument(
        "--limit",
        type=int,
        default=0,
        help="limit to number of items, default: 0 (no limit)",
    )
    p.add_argument(
        "--skip",
        default=None,
        type=int,
        help="skip this many items, default: None",
    )

    p.add_argument(
        "--content",
        default=False,
        action="store_true",
        help="rss: include (full) content tag, default: False",
    )
    p.add_argument(
        "--link",
        default="diffhtml,html,text",
        help="link variable will be to this version, can be comma-delim list, use first avail, default: diffhtml,html,text",
    )
    p.add_argument(
        "--linkbase",
        default=None,
        help="base url to use for links, default: try to use the feedurl",
    )
    p.add_argument("--output", default=None, help="output, default: stdout")

    p.add_argument(
        "--files",
        default=False,
        action="store_true",
        help="include files (experimental)",
    )

    pg = p.add_argument_group('template variables')
    pg.add_argument(
        "--feedurl",
        default="feed.xml",
        help="rss: to use as feeds own (self) link, default: feed.xml",
    )
    pg.add_argument(
        "--siteurl",
        default=None,
        help="rss: to use as channel's site link, default: the etherpad url",
    )
    pg.add_argument(
        "--title",
        default="etherpump",
        help="title for document or rss feed channel title, default: etherdump",
    )
    pg.add_argument(
        "--description",
        default="",
        help="rss: channel description, default: empty",
    )
    pg.add_argument(
        "--language", default="en-US", help="rss: feed language, default: en-US"
    )
    pg.add_argument(
        "--updatePeriod",
        default="daily",
        help="rss: updatePeriod, possible values: hourly, daily, weekly, monthly, yearly; default: daily",
    )
    pg.add_argument(
        "--updateFrequency",
        default=1,
        type=int,
        help="rss: update frequency within the update period (where 2 would mean twice per period); default: 1",
    )
    pg.add_argument(
        "--generator",
        default="https://gitlab.com/activearchives/etherpump",
        help="generator, default: https://gitlab.com/activearchives/etherdump",
    )
    pg.add_argument(
        "--timestamp",
        default=None,
        help="timestamp, default: now (e.g. 2015-12-01 12:30:00)",
    )
    pg.add_argument("--next", default=None, help="next link, default: None)")
    pg.add_argument("--prev", default=None, help="prev link, default: None")

    args = p.parse_args(args)

    tmpath = args.templatepath
    # Default path for template is the built-in data/templates
    if tmpath == None:
        tmpath = os.path.split(os.path.abspath(__file__))[0]
        tmpath = os.path.split(tmpath)[0]
        tmpath = os.path.join(tmpath, "data", "templates")

    env = Environment(loader=FileSystemLoader(tmpath))
    env.filters["excerpt"] = excerpt
    env.filters["datetimeformat"] = datetimeformat
    template = env.get_template(args.template)

    info = loadpadinfo(args.padinfo)

    inputs = args.input
    inputs.sort()
    # Use "base" to strip (longest) extensions
    # inputs = group(inputs, base)

    def wrappath(p):
        path = "./{0}".format(p)
        ext = os.path.splitext(p)[1][1:]
        return {"url": path, "path": path, "code": 200, "type": ext}

    def metaforpaths(paths):
        ret = {}
        pid = base(paths[0])
        ret['pad'] = ret['padid'] = pid
        ret['versions'] = [wrappath(x) for x in paths]
        lastedited = None
        for p in paths:
            mtime = os.stat(p).st_mtime
            if lastedited == None or mtime > lastedited:
                lastedited = mtime
        ret["lastedited_iso"] = datetime.fromtimestamp(lastedited).strftime(
            "%Y-%m-%dT%H:%M:%S"
        )
        ret["lastedited_raw"] = mtime
        return ret

    def loadmeta(p):
        # Consider a set of grouped files
        # Otherwise, create a "dummy" one that wraps all the files as versions
        if p.endswith(".meta.json"):
            with open(p) as f:
                return json.load(f)
        # # IF there is a .meta.json, load it & MERGE with other files
        # if ret:
        #     # TODO: merge with other files
        #     for p in paths:
        #         if "./"+p not in ret['versions']:
        #             ret['versions'].append(wrappath(p))
        #     return ret
        # else:
        #     return metaforpaths(paths)

    def fixdates(padmeta):
        d = dateutil.parser.parse(padmeta["lastedited_iso"])
        padmeta["lastedited"] = d
        padmeta["lastedited_822"] = d.strftime("%a, %d %b %Y %H:%M:%S +0000")
        return padmeta

    pads = list(map(loadmeta, inputs))
    pads = [x for x in pads if x != None]
    pads = list(map(fixdates, pads))
    args.pads = list(pads)

    def could_have_base(x, y):
        return x == y or (x.startswith(y) and x[len(y) :].startswith("."))

    def get_best_pad(x):
        for pb in padbases:
            p = pads_by_base[pb]
            if could_have_base(x, pb):
                return p

    def has_version(padinfo, path):
        return [
            x
            for x in padinfo['versions']
            if 'path' in x and x['path'] == "./" + path
        ]

    if args.files:
        inputs = args.input
        inputs.sort()
        removelist = []

        pads_by_base = {}
        for p in args.pads:
            # print ("Trying padid", p['padid'], file=sys.stderr)
            padbase = os.path.splitext(p['padid'])[0]
            pads_by_base[padbase] = p
        padbases = list(pads_by_base.keys())
        # SORT THEM LONGEST FIRST TO ensure that LONGEST MATCHES MATCH
        padbases.sort(key=lambda x: len(x), reverse=True)
        # print ("PADBASES", file=sys.stderr)
        # for pb in padbases:
        #     print ("  ", pb, file=sys.stderr)
        print("pairing input files with pads", file=sys.stderr)
        for x in inputs:
            # pair input with a pad if possible
            xbasename = os.path.basename(x)
            p = get_best_pad(xbasename)
            if p:
                if not has_version(p, x):
                    print(
                        "Grouping file {0} with pad {1}".format(x, p['padid']),
                        file=sys.stderr,
                    )
                    p['versions'].append(wrappath(x))
                else:
                    print(
                        "Skipping existing version {0} ({1})...".format(
                            x, p['padid']
                        ),
                        file=sys.stderr,
                    )
                removelist.append(x)
        # Removed Matches files
        for x in removelist:
            inputs.remove(x)
        print("Remaining files:", file=sys.stderr)
        for x in inputs:
            print(x, file=sys.stderr)
        print(file=sys.stderr)
        # Add "fake" pads for remaining files
        for x in inputs:
            args.pads.append(metaforpaths([x]))

    if args.timestamp == None:
        args.timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")

    padurlbase = re.sub(r"api/1.2.9/$", "p/", info["apiurl"])
    # if type(padurlbase) == unicode:
    #     padurlbase = padurlbase.encode("utf-8")
    args.siteurl = args.siteurl or padurlbase
    args.utcnow = datetime.utcnow().strftime("%a, %d %b %Y %H:%M:%S +0000")

    # order items & apply limit
    if args.order == "lastedited":
        args.pads.sort(
            key=lambda x: x.get("lastedited_iso"), reverse=args.reverse
        )
    elif args.order == "pad":
        args.pads.sort(key=lambda x: x.get("pad"), reverse=args.reverse)
    elif args.order == "padid":
        args.pads.sort(key=lambda x: x.get("padid"), reverse=args.reverse)
    elif args.order == "revisions":
        args.pads.sort(key=lambda x: x.get("revisions"), reverse=args.reverse)
    elif args.order == "authors":
        args.pads.sort(
            key=lambda x: len(x.get("authors")), reverse=args.reverse
        )
    elif args.order == "custom":

        # TODO: make this list non-static, but a variable that can be given from the CLI

        customorder = [
            'nooo.relearn.preamble',
            'nooo.relearn.activating.the.archive',
            'nooo.relearn.call.for.proposals',
            'nooo.relearn.call.for.proposals-proposal-footnote',
            'nooo.relearn.colophon',
        ]
        order = []
        for x in customorder:
            for pad in args.pads:
                if pad["padid"] == x:
                    order.append(pad)
        args.pads = order
    else:
        raise Exception("That ordering is not implemented!")

    if args.limit:
        args.pads = args.pads[: args.limit]

    # add versions_by_type, add in full text
    # add link (based on args.link)
    linkversions = args.link.split(",")
    linkbase = args.linkbase or url_base(args.feedurl)
    # print ("linkbase", linkbase, args.linkbase, args.feedurl)

    for p in args.pads:
        versions_by_type = {}
        p["versions_by_type"] = versions_by_type
        for v in p["versions"]:
            t = v["type"]
            versions_by_type[t] = v

        if "text" in versions_by_type:
            # try:
            with open(versions_by_type["text"]["path"]) as f:
                content = f.read()
                # print('content:', content)
                # [Relearn] Add pandoc command here?
                html = pypandoc.convert_text(content, 'html', format='md')
                # print('html:', html)
                p["text"] = html
            # except FileNotFoundError:
            # p['text'] = 'ERROR'

        # ADD IN LINK TO PAD AS "link"
        for v in linkversions:
            if v in versions_by_type:
                vdata = versions_by_type[v]
                try:
                    if v == "pad" or os.path.exists(vdata["path"]):
                        p["link"] = absurl(vdata["url"], linkbase)
                        break
                except KeyError as e:
                    pass

    if args.output:
        with open(args.output, "w") as f:
            print(template.render(vars(args)), file=f)
    else:
        print(template.render(vars(args)))
Add maintenance tools and run them 5 years ago			`import json`
			`import os`
			`import re`
			`import sys`
			`import time`
new 9 years ago			`from argparse import ArgumentParser`
index now generalized template publishing 9 years ago			`from datetime import datetime`
Add maintenance tools and run them 5 years ago			`from time import sleep`
			`from urllib.parse import quote, urlencode, urlparse, urlunparse`
			`from urllib.request import HTTPError, URLError, urlopen`
index command changes for python3 7 years ago
Add maintenance tools and run them 5 years ago			`from jinja2 import Environment, FileSystemLoader`
index command changes for python3 7 years ago
index now generalized template publishing 9 years ago			`import dateutil.parser`
Add maintenance tools and run them 5 years ago			`import pypandoc`
			`from etherpump.commands.common import *`

new pull, new meta style from live constant etherdumpÄ 9 years ago
index now generalized template publishing 9 years ago			`"""`
renaming all files to etherpump + adding a etherpump readme 5 years ago			`publication:`
			`Generate a single document from etherpumps using a template.`
index now generalized template publishing 9 years ago
Remove Python 2 cruft 5 years ago			`Built-in templates: publication.html`
index now generalized template publishing 9 years ago
			`"""`
new 9 years ago
Add maintenance tools and run them 5 years ago
			`def group(items, key=lambda x: x):`
index magic 7 years ago			`""" returns a list of lists, of items grouped by a key function """`
new 9 years ago			`ret = []`
			`keys = {}`
			`for item in items:`
			`k = key(item)`
			`if k not in keys:`
			`keys[k] = []`
			`keys[k].append(item)`
			`for k in sorted(keys):`
			`keys[k].sort()`
			`ret.append(keys[k])`
			`return ret`

Add maintenance tools and run them 5 years ago
index magic 7 years ago			`# def base (x):`
			`# return re.sub(r"(\.raw\.html)\|(\.diff\.html)\|(\.meta\.json)\|(\.raw\.txt)$", "", x)`

Add maintenance tools and run them 5 years ago
			`def splitextlong(x):`
index magic 7 years ago			`""" split "long" extensions, i.e. foo.bar.baz => ('foo', '.bar.baz') """`
			`m = re.search(r"^(.?)(\..)$", x)`
			`if m:`
			`return m.groups()`
			`else:`
			`return x, ''`

Add maintenance tools and run them 5 years ago
			`def base(x):`
index magic 7 years ago			`return splitextlong(x)[0]`
index now generalized template publishing 9 years ago
Add maintenance tools and run them 5 years ago
			`def excerpt(t, chars=25):`
index now generalized template publishing 9 years ago			`if len(t) > chars:`
			`t = t[:chars] + "..."`
			`return t`

Add maintenance tools and run them 5 years ago
			`def absurl(url, base=None):`
index now generalized template publishing 9 years ago			`if not url.startswith("http"):`
			`return base + url`
			`return url`

Add maintenance tools and run them 5 years ago
			`def url_base(url):`
index command changes for python3 7 years ago			`(scheme, netloc, path, params, query, fragment) = urlparse(url)`
index now generalized template publishing 9 years ago			`path, _ = os.path.split(path.lstrip("/"))`
index command changes for python3 7 years ago			`ret = urlunparse((scheme, netloc, path, None, None, None))`
index now generalized template publishing 9 years ago			`if ret:`
			`ret += "/"`
			`return ret`

Add maintenance tools and run them 5 years ago
			`def datetimeformat(t, format='%Y-%m-%d %H:%M:%S'):`
index magic 7 years ago			`if type(t) == str:`
			`dt = dateutil.parser.parse(t)`
			`return dt.strftime(format)`
			`else:`
			`return time.strftime(format, time.localtime(t))`

Add maintenance tools and run them 5 years ago
			`def main(args):`
index now generalized template publishing 9 years ago			`p = ArgumentParser("Convert dumped files to a document via a template.")`

index magic 7 years ago			`p.add_argument("input", nargs="+", help="Files to list (.meta.json files)")`

Add maintenance tools and run them 5 years ago			`p.add_argument(`
			`"--templatepath",`
			`default=None,`
			`help="path to find templates, default: built-in",`
			`)`
			`p.add_argument(`
			`"--template",`
			`default="publication.html",`
			`help="template name, built-ins include publication.html; default: publication.html",`
			`)`
			`p.add_argument(`
			`"--padinfo",`
			`default=".etherpump/settings.json",`
			`help="settings, default: ./.etherdump/settings.json",`
			`)`
index now generalized template publishing 9 years ago			`# p.add_argument("--zerorevs", default=False, action="store_true", help="include pads with zero revisions, default: False (i.e. pads with no revisions are skipped)")`

Add maintenance tools and run them 5 years ago			`p.add_argument(`
			`"--order",`
			`default="padid",`
			`help="order, possible values: padid, pad (no group name), lastedited, (number of) authors, revisions, default: padid",`
			`)`
			`p.add_argument(`
			`"--reverse",`
			`default=False,`
			`action="store_true",`
			`help="reverse order, default: False (reverse chrono)",`
			`)`
			`p.add_argument(`
			`"--limit",`
			`type=int,`
			`default=0,`
			`help="limit to number of items, default: 0 (no limit)",`
			`)`
			`p.add_argument(`
			`"--skip",`
			`default=None,`
			`type=int,`
			`help="skip this many items, default: None",`
			`)`

			`p.add_argument(`
			`"--content",`
			`default=False,`
			`action="store_true",`
			`help="rss: include (full) content tag, default: False",`
			`)`
			`p.add_argument(`
			`"--link",`
			`default="diffhtml,html,text",`
			`help="link variable will be to this version, can be comma-delim list, use first avail, default: diffhtml,html,text",`
			`)`
			`p.add_argument(`
			`"--linkbase",`
			`default=None,`
			`help="base url to use for links, default: try to use the feedurl",`
			`)`
added output option to index 9 years ago			`p.add_argument("--output", default=None, help="output, default: stdout")`
index now generalized template publishing 9 years ago
Add maintenance tools and run them 5 years ago			`p.add_argument(`
			`"--files",`
			`default=False,`
			`action="store_true",`
			`help="include files (experimental)",`
			`)`
make files behaviour optional and default false in index 6 years ago
index tweaks 9 years ago			`pg = p.add_argument_group('template variables')`
Add maintenance tools and run them 5 years ago			`pg.add_argument(`
			`"--feedurl",`
			`default="feed.xml",`
			`help="rss: to use as feeds own (self) link, default: feed.xml",`
			`)`
			`pg.add_argument(`
			`"--siteurl",`
			`default=None,`
			`help="rss: to use as channel's site link, default: the etherpad url",`
			`)`
			`pg.add_argument(`
			`"--title",`
			`default="etherpump",`
			`help="title for document or rss feed channel title, default: etherdump",`
			`)`
			`pg.add_argument(`
			`"--description",`
			`default="",`
			`help="rss: channel description, default: empty",`
			`)`
			`pg.add_argument(`
			`"--language", default="en-US", help="rss: feed language, default: en-US"`
			`)`
			`pg.add_argument(`
			`"--updatePeriod",`
			`default="daily",`
			`help="rss: updatePeriod, possible values: hourly, daily, weekly, monthly, yearly; default: daily",`
			`)`
			`pg.add_argument(`
			`"--updateFrequency",`
			`default=1,`
			`type=int,`
			`help="rss: update frequency within the update period (where 2 would mean twice per period); default: 1",`
			`)`
			`pg.add_argument(`
			`"--generator",`
			`default="https://gitlab.com/activearchives/etherpump",`
			`help="generator, default: https://gitlab.com/activearchives/etherdump",`
			`)`
			`pg.add_argument(`
			`"--timestamp",`
			`default=None,`
			`help="timestamp, default: now (e.g. 2015-12-01 12:30:00)",`
			`)`
added next and previous vars to index 9 years ago			`pg.add_argument("--next", default=None, help="next link, default: None)")`
			`pg.add_argument("--prev", default=None, help="prev link, default: None")`
index tweaks 9 years ago
new 9 years ago			`args = p.parse_args(args)`
Remove Python 2 cruft 5 years ago
index now generalized template publishing 9 years ago			`tmpath = args.templatepath`
			`# Default path for template is the built-in data/templates`
new 9 years ago			`if tmpath == None:`
			`tmpath = os.path.split(os.path.abspath(__file__))[0]`
			`tmpath = os.path.split(tmpath)[0]`
			`tmpath = os.path.join(tmpath, "data", "templates")`

			`env = Environment(loader=FileSystemLoader(tmpath))`
index now generalized template publishing 9 years ago			`env.filters["excerpt"] = excerpt`
index magic 7 years ago			`env.filters["datetimeformat"] = datetimeformat`
index now generalized template publishing 9 years ago			`template = env.get_template(args.template)`
new pull, new meta style from live constant etherdumpÄ 9 years ago
index now generalized template publishing 9 years ago			`info = loadpadinfo(args.padinfo)`
new 9 years ago
			`inputs = args.input`
			`inputs.sort()`
index magic 7 years ago			`# Use "base" to strip (longest) extensions`
			`# inputs = group(inputs, base)`

Add maintenance tools and run them 5 years ago			`def wrappath(p):`
index magic 7 years ago			`path = "./{0}".format(p)`
			`ext = os.path.splitext(p)[1][1:]`
Add maintenance tools and run them 5 years ago			`return {"url": path, "path": path, "code": 200, "type": ext}`

			`def metaforpaths(paths):`
index magic 7 years ago			`ret = {}`
			`pid = base(paths[0])`
			`ret['pad'] = ret['padid'] = pid`
			`ret['versions'] = [wrappath(x) for x in paths]`
			`lastedited = None`
new pull, new meta style from live constant etherdumpÄ 9 years ago			`for p in paths:`
Remove Python 2 cruft 5 years ago			`mtime = os.stat(p).st_mtime`
index magic 7 years ago			`if lastedited == None or mtime > lastedited:`
			`lastedited = mtime`
Add maintenance tools and run them 5 years ago			`ret["lastedited_iso"] = datetime.fromtimestamp(lastedited).strftime(`
			`"%Y-%m-%dT%H:%M:%S"`
			`)`
Remove Python 2 cruft 5 years ago			`ret["lastedited_raw"] = mtime`
index magic 7 years ago			`return ret`

			`def loadmeta(p):`
			`# Consider a set of grouped files`
			`# Otherwise, create a "dummy" one that wraps all the files as versions`
			`if p.endswith(".meta.json"):`
			`with open(p) as f:`
			`return json.load(f)`
			`# # IF there is a .meta.json, load it & MERGE with other files`
			`# if ret:`
			`# # TODO: merge with other files`
			`# for p in paths:`
			`# if "./"+p not in ret['versions']:`
			`# ret['versions'].append(wrappath(p))`
			`# return ret`
			`# else:`
			`# return metaforpaths(paths)`
new pull, new meta style from live constant etherdumpÄ 9 years ago
Add maintenance tools and run them 5 years ago			`def fixdates(padmeta):`
index now generalized template publishing 9 years ago			`d = dateutil.parser.parse(padmeta["lastedited_iso"])`
			`padmeta["lastedited"] = d`
			`padmeta["lastedited_822"] = d.strftime("%a, %d %b %Y %H:%M:%S +0000")`
			`return padmeta`

Migrate to Python 3 5 years ago			`pads = list(map(loadmeta, inputs))`
index magic 7 years ago			`pads = [x for x in pads if x != None]`
Migrate to Python 3 5 years ago			`pads = list(map(fixdates, pads))`
index command changes for python3 7 years ago			`args.pads = list(pads)`
index now generalized template publishing 9 years ago
Add maintenance tools and run them 5 years ago			`def could_have_base(x, y):`
			`return x == y or (x.startswith(y) and x[len(y) :].startswith("."))`
index magic 7 years ago
Add maintenance tools and run them 5 years ago			`def get_best_pad(x):`
index magic 7 years ago			`for pb in padbases:`
			`p = pads_by_base[pb]`
			`if could_have_base(x, pb):`
			`return p`

Add maintenance tools and run them 5 years ago			`def has_version(padinfo, path):`
			`return [`
			`x`
			`for x in padinfo['versions']`
			`if 'path' in x and x['path'] == "./" + path`
			`]`
make files behaviour optional and default false in index 6 years ago
			`if args.files:`
			`inputs = args.input`
			`inputs.sort()`
			`removelist = []`

			`pads_by_base = {}`
			`for p in args.pads:`
			`# print ("Trying padid", p['padid'], file=sys.stderr)`
			`padbase = os.path.splitext(p['padid'])[0]`
			`pads_by_base[padbase] = p`
			`padbases = list(pads_by_base.keys())`
			`# SORT THEM LONGEST FIRST TO ensure that LONGEST MATCHES MATCH`
			`padbases.sort(key=lambda x: len(x), reverse=True)`
			`# print ("PADBASES", file=sys.stderr)`
			`# for pb in padbases:`
			`# print (" ", pb, file=sys.stderr)`
Add maintenance tools and run them 5 years ago			`print("pairing input files with pads", file=sys.stderr)`
make files behaviour optional and default false in index 6 years ago			`for x in inputs:`
			`# pair input with a pad if possible`
			`xbasename = os.path.basename(x)`
			`p = get_best_pad(xbasename)`
			`if p:`
			`if not has_version(p, x):`
Add maintenance tools and run them 5 years ago			`print(`
			`"Grouping file {0} with pad {1}".format(x, p['padid']),`
			`file=sys.stderr,`
			`)`
Remove Python 2 cruft 5 years ago			`p['versions'].append(wrappath(x))`
make files behaviour optional and default false in index 6 years ago			`else:`
Add maintenance tools and run them 5 years ago			`print(`
			`"Skipping existing version {0} ({1})...".format(`
			`x, p['padid']`
			`),`
			`file=sys.stderr,`
			`)`
make files behaviour optional and default false in index 6 years ago			`removelist.append(x)`
			`# Removed Matches files`
			`for x in removelist:`
			`inputs.remove(x)`
Add maintenance tools and run them 5 years ago			`print("Remaining files:", file=sys.stderr)`
make files behaviour optional and default false in index 6 years ago			`for x in inputs:`
Add maintenance tools and run them 5 years ago			`print(x, file=sys.stderr)`
			`print(file=sys.stderr)`
make files behaviour optional and default false in index 6 years ago			`# Add "fake" pads for remaining files`
			`for x in inputs:`
			`args.pads.append(metaforpaths([x]))`
index magic 7 years ago
index tweaks 9 years ago			`if args.timestamp == None:`
			`args.timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")`
index now generalized template publishing 9 years ago
			`padurlbase = re.sub(r"api/1.2.9/$", "p/", info["apiurl"])`
index command changes for python3 7 years ago			`# if type(padurlbase) == unicode:`
			`# padurlbase = padurlbase.encode("utf-8")`
index now generalized template publishing 9 years ago			`args.siteurl = args.siteurl or padurlbase`
			`args.utcnow = datetime.utcnow().strftime("%a, %d %b %Y %H:%M:%S +0000")`

			`# order items & apply limit`
			`if args.order == "lastedited":`
Add maintenance tools and run them 5 years ago			`args.pads.sort(`
			`key=lambda x: x.get("lastedited_iso"), reverse=args.reverse`
			`)`
index now generalized template publishing 9 years ago			`elif args.order == "pad":`
			`args.pads.sort(key=lambda x: x.get("pad"), reverse=args.reverse)`
			`elif args.order == "padid":`
			`args.pads.sort(key=lambda x: x.get("padid"), reverse=args.reverse)`
			`elif args.order == "revisions":`
			`args.pads.sort(key=lambda x: x.get("revisions"), reverse=args.reverse)`
			`elif args.order == "authors":`
Add maintenance tools and run them 5 years ago			`args.pads.sort(`
			`key=lambda x: len(x.get("authors")), reverse=args.reverse`
			`)`
renaming all files to etherpump + adding a etherpump readme 5 years ago			`elif args.order == "custom":`

Add maintenance tools and run them 5 years ago			`# TODO: make this list non-static, but a variable that can be given from the CLI`
Remove Python 2 cruft 5 years ago
renaming all files to etherpump + adding a etherpump readme 5 years ago			`customorder = [`
			`'nooo.relearn.preamble',`
			`'nooo.relearn.activating.the.archive',`
			`'nooo.relearn.call.for.proposals',`
			`'nooo.relearn.call.for.proposals-proposal-footnote',`
Add maintenance tools and run them 5 years ago			`'nooo.relearn.colophon',`
			`]`
renaming all files to etherpump + adding a etherpump readme 5 years ago			`order = []`
			`for x in customorder:`
			`for pad in args.pads:`
			`if pad["padid"] == x:`
			`order.append(pad)`
			`args.pads = order`
index now generalized template publishing 9 years ago			`else:`
			`raise Exception("That ordering is not implemented!")`

			`if args.limit:`
Add maintenance tools and run them 5 years ago			`args.pads = args.pads[: args.limit]`
index now generalized template publishing 9 years ago
			`# add versions_by_type, add in full text`
			`# add link (based on args.link)`
			`linkversions = args.link.split(",")`
			`linkbase = args.linkbase or url_base(args.feedurl)`
			`# print ("linkbase", linkbase, args.linkbase, args.feedurl)`

index command changes for python3 7 years ago			`for p in args.pads:`
index now generalized template publishing 9 years ago			`versions_by_type = {}`
			`p["versions_by_type"] = versions_by_type`
			`for v in p["versions"]:`
			`t = v["type"]`
			`versions_by_type[t] = v`

index magic 7 years ago			`if "text" in versions_by_type:`
renaming all files to etherpump + adding a etherpump readme 5 years ago			`# try:`
Add maintenance tools and run them 5 years ago			`with open(versions_by_type["text"]["path"]) as f:`
renaming all files to etherpump + adding a etherpump readme 5 years ago			`content = f.read()`
			`# print('content:', content)`
			`# [Relearn] Add pandoc command here?`
			`html = pypandoc.convert_text(content, 'html', format='md')`
			`# print('html:', html)`
			`p["text"] = html`
			`# except FileNotFoundError:`
Add maintenance tools and run them 5 years ago			`# p['text'] = 'ERROR'`
renaming all files to etherpump + adding a etherpump readme 5 years ago
index magic 7 years ago			`# ADD IN LINK TO PAD AS "link"`
index now generalized template publishing 9 years ago			`for v in linkversions:`
index magic 7 years ago			`if v in versions_by_type:`
			`vdata = versions_by_type[v]`
			`try:`
			`if v == "pad" or os.path.exists(vdata["path"]):`
			`p["link"] = absurl(vdata["url"], linkbase)`
			`break`
			`except KeyError as e:`
			`pass`
index now generalized template publishing 9 years ago
added output option to index 9 years ago			`if args.output:`
			`with open(args.output, "w") as f:`
Add maintenance tools and run them 5 years ago			`print(template.render(vars(args)), file=f)`
added output option to index 9 years ago			`else:`
Add maintenance tools and run them 5 years ago			`print(template.render(vars(args)))`