Ignore errors in purging events

There is a known issue with purging the resource properties data for events where the same resource properties data is referenced by a resource or event in the backup stack. It's more important that we are able to store a new event than that we are able to purge old events, so catch any exceptions in purging and log an error, rather than allowing the exception to abort the event creation. Also use a transaction to ensure that we roll back the deletion of the events when we encounter an error. This ensures that any resource properties data *not* referenced by the backup stack is not orphaned because of failures deleting other rows. This will allow us to properly purge the database once the issue is fixed. Change-Id: Iefa706f91382f7d1c47e09e8f67a9fad53a9390b Story: #2002643 Task: 22334 (cherry picked from commit 6169ed4660)
2018-06-25 14:06:35 -04:00 · 2018-06-25 14:06:35 -04:00 · 7daa3bdbf3
parent 6526311b35
commit 7daa3bdbf3
1 changed files with 28 additions and 27 deletions
--- a/heat/db/sqlalchemy/api.py
+++ b/heat/db/sqlalchemy/api.py
@ -987,33 +987,31 @@ def _delete_event_rows(context, stack_id, limit):
    # So we must manually supply the IN() values.
    # pgsql SHOULD work with the pure DELETE/JOIN below but that must be
    # confirmed via integration tests.
-    query = _query_all_by_stack(context, stack_id)
    session = context.session
-    id_pairs = [(e.id, e.rsrc_prop_data_id) for e in query.order_by(
-        models.Event.id).limit(limit).all()]
-    if id_pairs is None:
-        return 0
-    (ids, rsrc_prop_ids) = zip(*id_pairs)
-    max_id = ids[-1]
-    # delete the events
-    retval = session.query(models.Event.id).filter(
-        models.Event.id <= max_id).filter(
-            models.Event.stack_id == stack_id).delete()
+    with session.begin():
+        query = _query_all_by_stack(context, stack_id)
+        query = query.order_by(models.Event.id).limit(limit)
+        id_pairs = [(e.id, e.rsrc_prop_data_id) for e in query.all()]
+        if not id_pairs:
+            return 0
+        (ids, rsrc_prop_ids) = zip(*id_pairs)
+        max_id = ids[-1]
+        # delete the events
+        retval = session.query(models.Event.id).filter(
+            models.Event.id <= max_id).filter(
+                models.Event.stack_id == stack_id).delete()

-    # delete unreferenced resource_properties_data
-    rsrc_prop_ids = set(rsrc_prop_ids)
-    if rsrc_prop_ids:
-        still_ref_ids_from_events = [e.rsrc_prop_data_id for e
-                                     in _query_all_by_stack(
-                                         context, stack_id).all()]
-        still_ref_ids_from_rsrcs = [r.rsrc_prop_data_id for r
-                                    in context.session.query(models.Resource).
-                                    filter_by(stack_id=stack_id).all()]
-        rsrc_prop_ids = rsrc_prop_ids - set(still_ref_ids_from_events) \
-            - set(still_ref_ids_from_rsrcs)
-        q_rpd = session.query(models.ResourcePropertiesData.id).filter(
-            models.ResourcePropertiesData.id.in_(rsrc_prop_ids))
-        q_rpd.delete(synchronize_session=False)
+        # delete unreferenced resource_properties_data
+        if rsrc_prop_ids:
+            ev_ref_ids = set(e.rsrc_prop_data_id for e
+                             in _query_all_by_stack(context, stack_id).all())
+            rsrc_ref_ids = set(r.rsrc_prop_data_id for r
+                               in session.query(models.Resource).filter_by(
+                                   stack_id=stack_id).all())
+            clr_prop_ids = set(rsrc_prop_ids) - ev_ref_ids - rsrc_ref_ids
+            q_rpd = session.query(models.ResourcePropertiesData.id).filter(
+                models.ResourcePropertiesData.id.in_(clr_prop_ids))
+            q_rpd.delete(synchronize_session=False)
    return retval


@ -1026,8 +1024,11 @@ def event_create(context, values):
            (event_count_all_by_stack(context, values['stack_id']) >=
             cfg.CONF.max_events_per_stack)):
            # prune
-            _delete_event_rows(
-                context, values['stack_id'], cfg.CONF.event_purge_batch_size)
+            try:
+                _delete_event_rows(context, values['stack_id'],
+                                   cfg.CONF.event_purge_batch_size)
+            except db_exception.DBError as exc:
+                LOG.error('Failed to purge events: %s', six.text_type(exc))
    event_ref = models.Event()
    event_ref.update(values)
    event_ref.save(context.session)