Source code for pymor.algorithms.adaptivegreedy

# This file is part of the pyMOR project (http://www.pymor.org).
# Copyright 2013-2020 pyMOR developers and contributors. All rights reserved.
# License: BSD 2-Clause License (http://opensource.org/licenses/BSD-2-Clause)

from fractions import Fraction

import numpy as np
import time

from pymor.algorithms.greedy import RBSurrogate
from pymor.core.base import BasicObject
from pymor.core.exceptions import ExtensionError
from pymor.core.logger import getLogger
from pymor.parallel.dummy import dummy_pool
from pymor.parameters.base import Mu, ParameterSpace


[docs]def adaptive_weak_greedy(surrogate, parameter_space, target_error=None, max_extensions=None,
                         validation_mus=0, rho=1.1, gamma=0.2, theta=0., visualize=False,
                         visualize_vertex_size=80, pool=None):
    """Weak greedy basis generation algorithm with adaptively refined training set.

    This method extends pyMOR's default :func:`~pymor.algorithms.greedy.weak_greedy`
    greedy basis generation algorithm by adaptive refinement of the
    parameter training set according to [HDO11]_ to prevent overfitting
    of the approximation basis to the training set. This is achieved by
    estimating the approximation error on an additional validation set of
    parameters. If the ratio between the estimated errors on the validation
    set and the validation set is larger than `rho`, the training set
    is refined using standard grid refinement techniques.

    Parameters
    ----------
    surrogate
        See :func:`~pymor.algorithms.greedy.weak_greedy`.
    parameter_space
        The |ParameterSpace| for which to compute the approximation basis.
    target_error
        See :func:`~pymor.algorithms.greedy.weak_greedy`.
    max_extensions
        See :func:`~pymor.algorithms.greedy.weak_greedy`.
    validation_mus
        One of the following:
          - a list of |Parameters| to use as validation set,
          - a positive number indicating the number of random parameters
            to use as validation set,
          - a non-positive number, indicating the negative number of random
            parameters to use as validation set in addition to the centers
            of the elements of the adaptive training set.
    rho
        Maximum allowed ratio between maximum estimated error on validation
        set vs. maximum estimated error on training set. If the ratio is
        larger, the training set is refined.
    gamma
        Weight of the age penalty term in the training set refinement
        indicators.
    theta
        Ratio of training set elements to select for refinement.
        (One element is always refined.)
    visualize
        If `True`, visualize the refinement indicators. (Only available
        for 2 and 3 dimensional parameter spaces.)
    visualize_vertex_size
        Size of the vertices in the visualization.
    pool
        See :func:`~pymor.algorithms.greedy.weak_greedy`.

    Returns
    -------
    Dict with the following fields:

        :extensions:             Number of greedy iterations.
        :max_errs:               Sequence of maximum errors during the greedy run.
        :max_err_mus:            The parameters corresponding to `max_errs`.
        :max_val_errs:           Sequence of maximum errors on the validation set.
        :max_val_err_mus:        The parameters corresponding to `max_val_errs`.
        :refinements:            Number of refinements made in each extension step.
        :training_set_sizes:     The final size of the training set in each extension step.
        :time:                   Duration of the algorithm.
    """

    logger = getLogger('pymor.algorithms.adaptivegreedy.adaptive_weak_greedy')

    if pool is None or pool is dummy_pool:
        pool = dummy_pool
    else:
        logger.info(f'Using pool of {len(pool)} workers for parallel greedy search.')

    tic = time.perf_counter()

    # setup training and validation sets
    sample_set = AdaptiveSampleSet(parameter_space)
    if validation_mus <= 0:
        validation_set = sample_set.center_mus + parameter_space.sample_randomly(-validation_mus)
    else:
        validation_set = parameter_space.sample_randomly(validation_mus)
    if visualize and sample_set.dim not in (2, 3):
        raise NotImplementedError
    logger.info(f'Training set size: {len(sample_set.vertex_mus)}. Validation set size: {len(validation_set)}')

    extensions = 0
    max_errs = []
    max_err_mus = []
    max_val_errs = []
    max_val_err_mus = []
    refinements = []
    training_set_sizes = []

    while True:  # main loop
        current_refinements = 0
        while True:  # estimate reduction errors and refine training set until no overfitting is detected

            # estimate on training set
            with logger.block('Estimating errors ...'):
                errors = surrogate.evaluate(sample_set.vertex_mus, return_all_values=True)
            max_err_ind = np.argmax(errors)
            max_err, max_err_mu = errors[max_err_ind], sample_set.vertex_mus[max_err_ind]
            logger.info(f'Maximum error after {extensions} extensions: {max_err} (mu = {max_err_mu})')

            # estimate on validation set
            max_val_err, max_val_err_mu = surrogate.evaluate(validation_set)
            logger.info(f'Maximum validation error: {max_val_err}')
            logger.info(f'Validation error to training error ratio: {max_val_err/max_err:.3e}')

            if max_val_err >= max_err * rho:  # overfitting?

                # compute element indicators for training set refinement
                if current_refinements == 0:
                    logger.info2('Overfitting detected. Computing element indicators ...')
                else:
                    logger.info3('Overfitting detected after refinement. Computing element indicators ...')
                vertex_errors = np.max(errors[sample_set.vertex_ids], axis=1)
                center_errors = surrogate.evaluate(sample_set.center_mus, return_all_values=True)
                indicators_age_part = (gamma * sample_set.volumes / sample_set.total_volume
                                       * (sample_set.refinement_count - sample_set.creation_times))
                indicators_error_part = np.max([vertex_errors, center_errors], axis=0) / max_err
                indicators = indicators_age_part + indicators_error_part

                # select elements
                sorted_indicators_inds = np.argsort(indicators)[::-1]
                refinement_elements = sorted_indicators_inds[:max(int(len(sorted_indicators_inds) * theta), 1)]
                logger.info(f'Refining {len(refinement_elements)} elements: {refinement_elements}')

                # visualization
                if visualize:
                    from mpl_toolkits.mplot3d import Axes3D  # NOQA
                    import matplotlib.pyplot as plt
                    plt.figure()
                    plt.subplot(2, 2, 1, projection=None if sample_set.dim == 2 else '3d')
                    plt.title('estimated errors')
                    sample_set.visualize(vertex_data=errors, center_data=center_errors, new_figure=False)
                    plt.subplot(2, 2, 2, projection=None if sample_set.dim == 2 else '3d')
                    plt.title('indicators_error_part')
                    vmax = np.max([indicators_error_part, indicators_age_part, indicators])
                    data = {('volume_data' if sample_set.dim == 2 else 'center_data'): indicators_error_part}
                    sample_set.visualize(vertex_size=visualize_vertex_size, vmin=0, vmax=vmax, new_figure=False,
                                         **data)
                    plt.subplot(2, 2, 3, projection=None if sample_set.dim == 2 else '3d')
                    plt.title('indicators_age_part')
                    data = {('volume_data' if sample_set.dim == 2 else 'center_data'): indicators_age_part}
                    sample_set.visualize(vertex_size=visualize_vertex_size, vmin=0, vmax=vmax, new_figure=False,
                                         **data)
                    plt.subplot(2, 2, 4, projection=None if sample_set.dim == 2 else '3d')
                    if sample_set.dim == 2:
                        plt.title('indicators')
                        sample_set.visualize(volume_data=indicators,
                                             center_data=np.zeros(len(refinement_elements)),
                                             center_inds=refinement_elements,
                                             vertex_size=visualize_vertex_size, vmin=0, vmax=vmax, new_figure=False)
                    else:
                        plt.title('selected cells')
                        sample_set.visualize(center_data=np.zeros(len(refinement_elements)),
                                             center_inds=refinement_elements,
                                             vertex_size=visualize_vertex_size, vmin=0, vmax=vmax, new_figure=False)
                    plt.show()

                # refine training set
                sample_set.refine(refinement_elements)
                current_refinements += 1

                # update validation set if needed
                if validation_mus <= 0:
                    validation_set = sample_set.center_mus + parameter_space.sample_randomly(-validation_mus)

                logger.info(f'New training set size: {len(sample_set.vertex_mus)}. '
                            f'New validation set size: {len(validation_set)}')
                logger.info(f'Number of refinements: {sample_set.refinement_count}')
                logger.info('')
            else:
                break  # no overfitting, leave the refinement loop

        max_errs.append(max_err)
        max_err_mus.append(max_err_mu)
        max_val_errs.append(max_val_err)
        max_val_err_mus.append(max_val_err_mu)
        refinements.append(current_refinements)
        training_set_sizes.append(len(sample_set.vertex_mus))

        # break if traget error reached
        if target_error is not None and max_err <= target_error:
            logger.info(f'Reached maximal error on snapshots of {max_err} <= {target_error}')
            break

        # basis extension
        with logger.block(f'Extending surrogate for mu = {max_err_mu} ...'):
            try:
                surrogate.extend(max_err_mu)
            except ExtensionError:
                logger.info('Extension failed. Stopping now.')
                break
            extensions += 1

        logger.info('')

        # break if prescribed basis size reached
        if max_extensions is not None and extensions >= max_extensions:
            logger.info(f'Maximum number of {max_extensions} extensions reached.')
            break

    tictoc = time.perf_counter() - tic
    logger.info(f'Greedy search took {tictoc} seconds')
    return {'max_errs': max_errs, 'max_err_mus': max_err_mus, 'extensions': extensions,
            'max_val_errs': max_val_errs, 'max_val_err_mus': max_val_err_mus,
            'refinements': refinements, 'training_set_sizes': training_set_sizes,
            'time': tictoc}


[docs]def rb_adaptive_greedy(fom, reductor, parameter_space,
                       use_error_estimator=True, error_norm=None,
                       target_error=None, max_extensions=None,
                       validation_mus=0, rho=1.1, gamma=0.2, theta=0.,
                       extension_params=None, visualize=False, visualize_vertex_size=80,
                       pool=None):
    """Reduced basis greedy basis generation with adaptively refined training set.

    This method extends pyMOR's default :func:`~pymor.algorithms.greedy.rb_greedy`
    greedy reduced basis generation algorithm by adaptive refinement of the
    parameter training set [HDO11]_ to prevent overfitting
    of the reduced basis to the training set as implemented in :func:`adaptive_weak_greedy`.

    Parameters
    ----------
    fom
        See :func:`~pymor.algorithms.greedy.rb_greedy`.
    reductor
        See :func:`~pymor.algorithms.greedy.rb_greedy`.
    parameter_space
        The |ParameterSpace| for which to compute the reduced model.
    use_error_estimator
        See :func:`~pymor.algorithms.greedy.rb_greedy`.
    error_norm
        See :func:`~pymor.algorithms.greedy.rb_greedy`.
    target_error
        See :func:`~pymor.algorithms.greedy.weak_greedy`.
    max_extensions
        See :func:`~pymor.algorithms.greedy.weak_greedy`.
    validation_mus
        See :func:`~adaptive_weak_greedy`.
    rho
        See :func:`~adaptive_weak_greedy`.
    gamma
        See :func:`~adaptive_weak_greedy`.
    theta
        See :func:`~adaptive_weak_greedy`.
    extension_params
        See :func:`~pymor.algorithms.greedy.rb_greedy`.
    visualize
        See :func:`~adaptive_weak_greedy`.
    visualize_vertex_size
        See :func:`~adaptive_weak_greedy`.
    pool
        See :func:`~pymor.algorithms.greedy.weak_greedy`.

    Returns
    -------
    Dict with the following fields:

        :rom:                    The reduced |Model| obtained for the
                                 computed basis.
        :extensions:             Number of greedy iterations.
        :max_errs:               Sequence of maximum errors during the greedy run.
        :max_err_mus:            The parameters corresponding to `max_errs`.
        :max_val_errs:           Sequence of maximum errors on the validation set.
        :max_val_err_mus:        The parameters corresponding to `max_val_errs`.
        :refinements:            Number of refinements made in each extension step.
        :training_set_sizes:     The final size of the training set in each extension step.
        :time:                   Duration of the algorithm.
    """

    surrogate = RBSurrogate(fom, reductor, use_error_estimator, error_norm, extension_params, pool or dummy_pool)

    result = adaptive_weak_greedy(surrogate, parameter_space, target_error=target_error, max_extensions=max_extensions,
                                  validation_mus=validation_mus, rho=rho, gamma=gamma, theta=theta, visualize=visualize,
                                  visualize_vertex_size=visualize_vertex_size, pool=pool)
    result['rom'] = surrogate.rom

    return result


[docs]class AdaptiveSampleSet(BasicObject):
    """An adaptive parameter sample set.

    Used by :func:`adaptive_weak_greedy`.
    """

    def __init__(self, parameter_space):
        assert isinstance(parameter_space, ParameterSpace)
        self.parameter_space = parameter_space
        self.parameters = parameter_space.parameters
        self.ranges = np.concatenate([np.tile(np.array(parameter_space.ranges[k])[np.newaxis, :],
                                              [np.prod(shape), 1])
                                      for k, shape in parameter_space.parameters.items()], axis=0)
        self.dimensions = self.ranges[:, 1] - self.ranges[:, 0]
        self.total_volume = np.prod(self.dimensions)
        self.dim = len(self.dimensions)
        self._vertex_to_id_map = {}
        self.vertices = []
        self.vertex_mus = []
        self.refinement_count = 0
        self.element_tree = self.Element(0, (Fraction(1, 2),) * self.dim, self)
        self._update()

    def refine(self, ids):
        self.refinement_count += 1
        leafs = [node for i, node in enumerate(self._iter_leafs()) if i in ids]
        for node in leafs:
            node.refine(self)
        self._update()

    def map_vertex_to_mu(self, vertex):
        values = self.ranges[:, 0] + self.dimensions * list(map(float, vertex))
        mu = {}
        for k, shape in self.parameters.items():
            count = np.prod(shape, dtype=int)
            head, values = values[:count], values[count:]
            mu[k] = np.array(head).reshape(shape)
        return Mu(mu)

    def visualize(self, vertex_data=None, vertex_inds=None, center_data=None, center_inds=None, volume_data=None,
                  vertex_size=80, vmin=None, vmax=None, new_figure=True):
        if self.dim not in (2, 3):
            raise ValueError('Can only visualize samples of dimension 2, 3')

        vertices = np.array(self.vertices).astype(float) * self.dimensions[np.newaxis, :] + self.ranges[:, 0]
        centers = np.array(self.centers).astype(float) * self.dimensions[np.newaxis, :] + self.ranges[:, 0]
        if vmin is None:
            vmin = np.inf
            if vertex_data is not None:
                vmin = min(vmin, np.min(vertex_data))
            if center_data is not None:
                vmin = min(vmin, np.min(center_data))
            if volume_data is not None:
                vmin = min(vmin, np.min(volume_data))

        if vmax is None:
            vmax = -np.inf
            if vertex_data is not None:
                vmax = max(vmax, np.max(vertex_data))
            if center_data is not None:
                vmax = max(vmax, np.max(center_data))
            if volume_data is not None:
                vmax = max(vmax, np.max(volume_data))

        if self.dim == 2:
            import matplotlib.pyplot as plt
            from matplotlib.collections import PatchCollection
            from matplotlib.patches import Rectangle
            if new_figure:
                plt.figure()
            plt.xlim(self.ranges[0])
            plt.ylim(self.ranges[1])

            # draw volumes
            rects = []
            for leaf, level in zip(self.vertex_ids, self.levels):
                size = 1. / 2**level
                ll = self.vertices[leaf[0]] * self.dimensions + self.ranges[:, 0]
                rects.append(Rectangle(ll, size * self.dimensions[0], size * self.dimensions[1],
                                       facecolor='white', zorder=-1))
            if volume_data is not None:
                coll = PatchCollection(rects, match_original=False)
                coll.set_array(volume_data)
                coll.set_clim(vmin, vmax)
            else:
                coll = PatchCollection(rects, match_original=True)
            plt.gca().add_collection(coll)
            plt.sci(coll)

            # draw vertex data
            if vertex_data is not None:
                vtx = vertices[vertex_inds] if vertex_inds is not None else vertices
                plt.scatter(vtx[:, 0], vtx[:, 1], c=vertex_data, vmin=vmin, vmax=vmax, s=vertex_size)

            # draw center data
            if center_data is not None:
                cts = centers[center_inds] if center_inds is not None else centers
                plt.scatter(cts[:, 0], cts[:, 1], c=center_data, vmin=vmin, vmax=vmax, s=vertex_size)

            if volume_data is not None or center_data is not None or vertex_data is not None:
                plt.colorbar()
            if new_figure:
                plt.show()

        elif self.dim == 3:
            if volume_data is not None:
                raise NotImplementedError

            cube = np.array([[0., 0., 0.],
                             [1., 0., 0.],
                             [1., 1., 0.],
                             [0., 1., 0.],
                             [0., 0., 0.],
                             [0., 0., 1.],
                             [1., 0., 1.],
                             [1., 0., 0.],
                             [1., 0., 1.],
                             [1., 1., 1.],
                             [1., 1., 0.],
                             [1., 1., 1.],
                             [0., 1., 1.],
                             [0., 1., 0.],
                             [0., 1., 1.],
                             [0., 0., 1.]])

            from mpl_toolkits.mplot3d import Axes3D  # NOQA
            import matplotlib.pyplot as plt
            if new_figure:
                plt.figure()
                plt.gca().add_subplot(111, projection='3d')
            ax = plt.gca()

            # draw cells
            for leaf, level in zip(self.vertex_ids, self.levels):
                size = 1. / 2**level
                ll = self.vertices[leaf[0]] * self.dimensions + self.ranges[:, 0]
                c = cube * self.dimensions * size + ll
                ax.plot3D(c[:, 0], c[:, 1], c[:, 2], color='lightgray', zorder=-1)

            p = None
            # draw vertex data
            if vertex_data is not None:
                vtx = vertices[vertex_inds] if vertex_inds is not None else vertices
                p = ax.scatter(vtx[:, 0], vtx[:, 1], vtx[:, 2],
                               c=vertex_data, vmin=vmin, vmax=vmax, s=vertex_size)

            # draw center data
            if center_data is not None:
                cts = centers[center_inds] if center_inds is not None else centers
                p = ax.scatter(cts[:, 0], cts[:, 1], cts[:, 2],
                               c=center_data, vmin=vmin, vmax=vmax, s=vertex_size)

            if p is not None:
                plt.colorbar(p)
            if new_figure:
                plt.show()

        else:
            assert False

    def _iter_leafs(self):
        def walk(node):
            if node.children:
                for node in node.children:
                    for leaf in walk(node):
                        yield leaf
            else:
                yield node

        return walk(self.element_tree)

    def _update(self):
        self.levels, self.centers, vertex_ids, creation_times = \
            list(zip(*((node.level, node.center, node.vertex_ids, node.creation_time) for node in self._iter_leafs())))
        self.levels = np.array(self.levels)
        self.volumes = self.total_volume / ((2**self.dim)**self.levels)
        self.vertex_ids = np.array(vertex_ids)
        self.center_mus = [self.map_vertex_to_mu(v) for v in self.centers]
        self.creation_times = np.array(creation_times)

    def _add_vertex(self, v):
        v_id = self._vertex_to_id_map.get(v)
        if v_id is None:
            v_id = len(self.vertices)
            self.vertices.append(v)
            self.vertex_mus.append(self.map_vertex_to_mu(v))
            self._vertex_to_id_map[v] = v_id
        return v_id

    class Element:
        __slots__ = ['level', 'center', 'vertex_ids', 'children', 'creation_time']

        def __init__(self, level, center, sample_set):
            self.level, self.center, self.creation_time = level, center, sample_set.refinement_count
            vertex_ids = []
            lower_corner = [x - Fraction(1, 2**(level + 1)) for x in center]
            for x in range(2**len(center)):
                v = list(lower_corner)
                for d in range(len(center)):
                    y, x = x % 2, x // 2
                    if y:
                        v[d] += Fraction(1, 2**level)
                vertex_ids.append(sample_set._add_vertex(tuple(v)))

            self.vertex_ids = vertex_ids
            self.children = []

        def refine(self, sample_set):
            level = self.level
            center = self.center
            for x in range(2**len(center)):
                v = list(center)
                for d in range(len(center)):
                    y, x = x % 2, x // 2
                    v[d] += Fraction(1, 2**(level+2)) * (y * 2 - 1)
                self.children.append(AdaptiveSampleSet.Element(level + 1, tuple(v), sample_set))