From cf1744373f446c41f61c08738730c2044c9a2a89 Mon Sep 17 00:00:00 2001
From: John Fulton <fulton@redhat.com>
Date: Tue, 8 Sep 2020 18:50:53 +0000
Subject: [PATCH] Derive HCI reseverved host memory without average guest
 workload

Add new option to tripleo_derive_hci_parameters module so that
if both the average_guest_cpu_utilization_percentage and the
average_guest_memory_size_in_mb are not passed, then a simpler
calculation is performed which computes the required memory for
the Ceph OSDs.

It is preferable for the user to pass the expected workload but
if this value is unknown it is still better to at least reserve
the bare minimum in memory for the OSDs so that they do not get
shutdown from an OOM error.

Change-Id: I68ad3783d3e0bf47fd63ab79f6ea0b0655c751c1
---
 .../modules/tripleo_derive_hci_parameters.py  | 99 ++++++++++++-------
 .../modules/test_derive_hci_parameters.py     |  8 ++
 2 files changed, 71 insertions(+), 36 deletions(-)

diff --git a/tripleo_ansible/ansible_plugins/modules/tripleo_derive_hci_parameters.py b/tripleo_ansible/ansible_plugins/modules/tripleo_derive_hci_parameters.py
index 8b3602fee..17d47421d 100644
--- a/tripleo_ansible/ansible_plugins/modules/tripleo_derive_hci_parameters.py
+++ b/tripleo_ansible/ansible_plugins/modules/tripleo_derive_hci_parameters.py
@@ -48,12 +48,14 @@ options:
         type: map
     average_guest_cpu_utilization_percentage:
         description: Percentage of CPU utilization expected for average guest, e.g. 99 means 99% and 10 means 10%
-        required: True
+        required: False
         type: int
+        default: 0
     average_guest_memory_size_in_mb:
         description: Amount of memory in MB required by the average guest
-        required: True
+        required: False
         type: int
+        default: 0
     derived_parameters:
         description: any previously derived parameters which should be included in the final result
         required: False
@@ -113,11 +115,13 @@ derived_parameters:
 MB_PER_GB = 1024
 
 
-def derive(mem_gb, vcpus, osds, average_guest_memory_size_in_mb,
-           average_guest_cpu_utilization_percentage,
+def derive(mem_gb, vcpus, osds, average_guest_memory_size_in_mb=0,
+           average_guest_cpu_utilization_percentage=0,
            mem_gb_per_osd=5, vcpus_per_osd=1.0, total_memory_threshold=0.8):
     """
-    Determines the recommended Nova scheduler values based on Ceph needs.
+    Determines the recommended Nova scheduler values based on Ceph needs
+    and described average Nova guest workload in CPU and Memory utilization.
+    If expected guest utilization is not provided result is less accurate.
     Returns dictionary containing the keys: cpu_allocation_ratio (float),
     nova_reserved_mem_mb (int), message (string), failed (boolean).
     """
@@ -128,6 +132,12 @@ def derive(mem_gb, vcpus, osds, average_guest_memory_size_in_mb,
     derived['message'] = ""
     derived['failed'] = False
 
+    if average_guest_memory_size_in_mb == 0 and \
+       average_guest_cpu_utilization_percentage == 0:
+        workload = False
+    else:
+        workload = True
+
     # catch possible errors in parameters
     if mem_gb < 1:
         msg = "Unable to determine the amount of physical memory "
@@ -147,13 +157,13 @@ def derive(mem_gb, vcpus, osds, average_guest_memory_size_in_mb,
         derived['message'] += msg + "\n"
         derived['failed'] = True
 
-    if average_guest_memory_size_in_mb < 0:
-        msg = "The average_guest_memory_size_in_mb must be a positive integer."
+    if average_guest_memory_size_in_mb < 0 and workload:
+        msg = "If average_guest_memory_size_in_mb is used it must be greater than 0"
         derived['message'] += msg + "\n"
         derived['failed'] = True
 
-    if average_guest_cpu_utilization_percentage < 0:
-        msg = "The average_guest_cpu_utilization_percentage must be a positive integer."
+    if average_guest_cpu_utilization_percentage < 0 and workload:
+        msg = "If average_guest_cpu_utilization_percentage is used it must be greater than 0"
         derived['message'] += msg + "\n"
         derived['failed'] = True
 
@@ -169,19 +179,23 @@ def derive(mem_gb, vcpus, osds, average_guest_memory_size_in_mb,
         return derived
 
     # perform the calculation
-    average_guest_size = average_guest_memory_size_in_mb / float(MB_PER_GB)
-    average_guest_util = average_guest_cpu_utilization_percentage * 0.01
-    number_of_guests = int(left_over_mem
-                           / (average_guest_size + gb_overhead_per_guest))
-    nova_reserved_mem_mb = MB_PER_GB * ((mem_gb_per_osd * osds)
-                                        + (number_of_guests * gb_overhead_per_guest))
-    nonceph_vcpus = vcpus - (vcpus_per_osd * osds)
-    guest_vcpus = nonceph_vcpus / average_guest_util
-    cpu_allocation_ratio = guest_vcpus / vcpus
+    if workload:
+        average_guest_size = average_guest_memory_size_in_mb / float(MB_PER_GB)
+        average_guest_util = average_guest_cpu_utilization_percentage * 0.01
+        number_of_guests = int(left_over_mem
+                               / (average_guest_size + gb_overhead_per_guest))
+        nova_reserved_mem_mb = MB_PER_GB * ((mem_gb_per_osd * osds)
+                                            + (number_of_guests * gb_overhead_per_guest))
+        nonceph_vcpus = vcpus - (vcpus_per_osd * osds)
+        guest_vcpus = nonceph_vcpus / average_guest_util
+        cpu_allocation_ratio = guest_vcpus / vcpus
+    else:
+        nova_reserved_mem_mb = MB_PER_GB * (mem_gb_per_osd * osds)
 
     # save calculation results
-    derived['cpu_allocation_ratio'] = cpu_allocation_ratio
     derived['nova_reserved_mem_mb'] = int(nova_reserved_mem_mb)
+    if workload:
+        derived['cpu_allocation_ratio'] = cpu_allocation_ratio
 
     # capture derivation details in message
     msg = "Derived Parameters results"
@@ -189,29 +203,41 @@ def derive(mem_gb, vcpus, osds, average_guest_memory_size_in_mb,
     msg += "\n - Total host RAM in GB: %d" % mem_gb
     msg += "\n - Total host vCPUs: %d" % vcpus
     msg += "\n - Ceph OSDs per host: %d" % osds
-    msg += "\n - Average guest memory size in GB: %d" % average_guest_size
-    msg += "\n - Average guest CPU utilization: %.0f%%" % \
-           average_guest_cpu_utilization_percentage
+    if workload:
+        msg += "\n - Average guest memory size in GB: %d" % average_guest_size
+        msg += "\n - Average guest CPU utilization: %.0f%%" % \
+               average_guest_cpu_utilization_percentage
     msg += "\n "
     msg += "\n Outputs:"
-    msg += "\n - number of guests allowed based on memory = %d" % number_of_guests
-    msg += "\n - number of guest vCPUs allowed = %d" % int(guest_vcpus)
+    if workload:
+        msg += "\n - number of guests allowed based on memory = %d" % number_of_guests
+        msg += "\n - number of guest vCPUs allowed = %d" % int(guest_vcpus)
+        msg += "\n - nova.conf cpu_allocation_ratio = %2.2f" % cpu_allocation_ratio
     msg += "\n - nova.conf reserved_host_memory = %d MB" % nova_reserved_mem_mb
-    msg += "\n - nova.conf cpu_allocation_ratio = %2.2f" % cpu_allocation_ratio
-    msg += "\n "
-    msg += "\nCompare \"guest vCPUs allowed\" to \"guests allowed based on memory\""
-    msg += "\nfor actual guest count."
     msg += "\n "
+    if workload:
+        msg += "\nCompare \"guest vCPUs allowed\" to \"guests allowed based on memory\""
+        msg += "\nfor actual guest count."
+        msg += "\n "
 
     warning_msg = ""
     if nova_reserved_mem_mb > (MB_PER_GB * mem_gb * total_memory_threshold):
         warning_msg += "ERROR: %d GB is not enough memory to run hyperconverged\n" % mem_gb
         derived['failed'] = True
-    if cpu_allocation_ratio < 0.5:
-        warning_msg += "ERROR: %d is not enough vCPU to run hyperconverged\n" % vcpus
-        derived['failed'] = True
-    if cpu_allocation_ratio > 16.0:
-        warning_msg += "WARNING: do not increase vCPU overcommit ratio beyond 16:1\n"
+    if workload:
+        if cpu_allocation_ratio < 0.5:
+            warning_msg += "ERROR: %d is not enough vCPU to run hyperconverged\n" % vcpus
+            derived['failed'] = True
+        if cpu_allocation_ratio > 16.0:
+            warning_msg += "WARNING: do not increase vCPU overcommit ratio beyond 16:1\n"
+    else:
+        warning_msg += "WARNING: the average guest workload was not provided. \n"
+        warning_msg += "Both average_guest_cpu_utilization_percentage and \n"
+        warning_msg += "average_guest_memory_size_in_mb are defaulted to 0. \n"
+        warning_msg += "The HCI derived parameter calculation cannot set the \n"
+        warning_msg += "Nova cpu_allocation_ratio. The Nova reserved_host_memory_mb \n"
+        warning_msg += "will be set based on the number of OSDs but the Nova \n"
+        warning_msg += "guest memory overhead will not be taken into account. \n"
     derived['message'] = warning_msg + msg
 
     return derived
@@ -422,8 +448,8 @@ def main():
         tripleo_environment_parameters=dict(type=dict, required=True),
         tripleo_role_name=dict(type=str, required=True),
         introspection_data=dict(type=dict, required=True),
-        average_guest_cpu_utilization_percentage=dict(type=int, required=True),
-        average_guest_memory_size_in_mb=dict(type=int, required=True),
+        average_guest_cpu_utilization_percentage=dict(type=int, required=False, default=0),
+        average_guest_memory_size_in_mb=dict(type=int, required=False, default=0),
         derived_parameters=dict(type=dict, required=False),
         new_heat_environment_path=dict(type=str, required=False),
         report_path=dict(type=str, required=False),
@@ -465,7 +491,8 @@ def main():
     if not derivation['failed']:
         role_derivation = {}
         role_derivation['NovaReservedHostMemory'] = derivation['nova_reserved_mem_mb']
-        role_derivation['NovaCPUAllocationRatio'] = derivation['cpu_allocation_ratio']
+        if 'cpu_allocation_ratio' in derivation:
+            role_derivation['NovaCPUAllocationRatio'] = derivation['cpu_allocation_ratio']
         role_name_parameters = module.params['tripleo_role_name'] + 'Parameters'
         existing_params[role_name_parameters] = role_derivation
         # write out to file if requested
diff --git a/tripleo_ansible/tests/modules/test_derive_hci_parameters.py b/tripleo_ansible/tests/modules/test_derive_hci_parameters.py
index e61a6a041..078c70995 100644
--- a/tripleo_ansible/tests/modules/test_derive_hci_parameters.py
+++ b/tripleo_ansible/tests/modules/test_derive_hci_parameters.py
@@ -153,3 +153,11 @@ class TestTripleoDeriveHciParameters(tests_base.TestCase):
             self.assertEqual(vcpu_ratio, ratio_map[flavor])
             self.assertIsNotNone(vcpu_msg)
             self.assertFalse(vcpu_warn)
+
+    def test_derive_without_workload(self):
+        """Test the derive method without passing the expected average
+        guest cpu and mem utilization and confirm expected result
+        """
+        der = derive_params.derive(mem_gb=256, vcpus=56, osds=16)
+        self.assertFalse(der['failed'])
+        self.assertEqual(der['nova_reserved_mem_mb'], 81920)