{"id":146107,"date":"2025-07-25T10:55:03","date_gmt":"2025-07-25T05:25:03","guid":{"rendered":"https:\/\/data-flair.training\/blogs\/?p=146107"},"modified":"2025-07-25T10:55:03","modified_gmt":"2025-07-25T05:25:03","slug":"lifestyle-health-risk-prediction-using-machine-learning","status":"publish","type":"post","link":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/","title":{"rendered":"ML Project &#8211; Lifestyle Health Risk Prediction using K-means Clustering"},"content":{"rendered":"<h3>Program 1<\/h3>\n<p><a href=\"https:\/\/drive.google.com\/file\/d\/1ttl-Km_sARxgZm5q85j9R-R6Abf-WWwd\/view?usp=sharing\" target=\"_blank\" rel=\"noopener\"><strong>Lifestyle Health Risk Dataset<\/strong><\/a><\/p>\n<p><a href=\"https:\/\/drive.google.com\/file\/d\/1q4gCFnd8RolnEONJ1AzD_XqWfrmnwfaR\/view?usp=sharing\" target=\"_blank\" rel=\"noopener\"><strong>Lifestyle Health Risk Dataset 1<\/strong><\/a><\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\">import pandas as pd # For handling tabular data.\r\nimport numpy as np #For numerical operations and random data generation.\r\nimport matplotlib.pyplot as plt # For plotting graphs.\r\nfrom sklearn.cluster import KMeans   # Unsupervised clustering algorithm from sklearn.\r\nfrom sklearn.preprocessing import StandardScaler  #Used to normalize features (mean = 0, std = 1).\r\n\r\nnp.random.seed(42) #  Ensures reproducibility of the random data.\r\nn_people = 200 # Total number of synthetic individuals.\r\n\r\ndata = {\r\n    'PersonID': np.arange(1, n_people + 1),\r\n    'Exercise (hrs\/week)': np.random.normal(3, 1.5, n_people).clip(0, 10),  # Mean (\u03bc) = 3 Standard deviation (\u03c3) = 1.5\r\n    'Sleep (hrs\/day)': np.random.normal(7, 1.0, n_people).clip(3, 10),\r\n    'Junk Food (times\/week)': np.random.randint(0, 8, n_people),\r\n    'Screen Time (hrs\/day)': np.random.normal(6, 2.0, n_people).clip(2, 14)\r\n}\r\ndf = pd.DataFrame(data)\r\ndf\r\n# Creates synthetic values for 4 lifestyle habits:\r\n# Exercise: Normally distributed around 3 hrs\/week (clipped 0\u201310)\r\n# Sleep: Around 7 hrs\/day (clipped 3\u201310)\r\n# Junk Food: Integer from 0\u20137\r\n# Screen Time: Around 6 hrs\/day (clipped 2\u201314)\r\n\r\ndf.to_csv('D:\/\/scikit_data\/KMeans\/lifestyle_health_risk.csv', index=False)\r\n\r\n# Feature Selection &amp; Normalization\r\n\r\nfeatures = ['Exercise (hrs\/week)', 'Sleep (hrs\/day)', 'Junk Food (times\/week)', 'Screen Time (hrs\/day)']\r\nX = df[features]\r\nscaler = StandardScaler()\r\nX_scaled = scaler.fit_transform(X)\r\nX_scaled\r\n# Select only the relevant columns (exclude PersonID).\r\n# Normalize all features so that they contribute equally during clustering.\r\n# Output is a scaled X_scaled array (mean=0, std=1).\r\n\r\n#Apply K-Means Clustering\r\nkmeans = KMeans(n_clusters=3, random_state=42)\r\ndf['Health Risk Category'] = kmeans.fit_predict(X_scaled)\r\ndf.to_csv('D:\/\/scikit_data\/KMeans\/lifestyle_health_risk1.csv', index=False)\r\n\r\n# A  scatter plot showing how people are grouped based on their sleep and diet habits.\r\n# Helps visually identify which group is more or less healthy.\r\n\r\nplt.figure(figsize=(8, 6))\r\nplt.scatter(df['Sleep (hrs\/day)'], df['Junk Food (times\/week)'],\r\n            c=df['Health Risk Category'], cmap='coolwarm', s=60)\r\nplt.scatter(\r\n    scaler.inverse_transform(kmeans.cluster_centers_)[:, 1],\r\n    scaler.inverse_transform(kmeans.cluster_centers_)[:, 2],\r\n    s=200, c='black', marker='X', label='Centroids')\r\n\r\nplt.title('Lifestyle Clustering: Sleep vs. Junk Food')\r\nplt.xlabel('Sleep (hrs\/day)')\r\nplt.ylabel('Junk Food (times\/week)')\r\nplt.legend()\r\nplt.grid(True)\r\nplt.tight_layout()\r\nplt.show()\r\n<\/pre>\n<p>&nbsp;<\/p>\n<p>&nbsp;<span hidden class=\"__iawmlf-post-loop-links\" data-iawmlf-links=\"[{&quot;id&quot;:24,&quot;href&quot;:&quot;https:\\\/\\\/drive.google.com\\\/file\\\/d\\\/1ttl-Km_sARxgZm5q85j9R-R6Abf-WWwd\\\/view?usp=sharing&quot;,&quot;archived_href&quot;:&quot;http:\\\/\\\/web-wp.archive.org\\\/web\\\/20251205103621\\\/https:\\\/\\\/drive.google.com\\\/file\\\/d\\\/1ttl-Km_sARxgZm5q85j9R-R6Abf-WWwd\\\/view?usp=sharing&quot;,&quot;redirect_href&quot;:&quot;&quot;,&quot;checks&quot;:[{&quot;date&quot;:&quot;2026-01-07 07:21:32&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-01-22 19:51:00&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-01-29 05:36:13&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-09 09:16:22&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-16 00:09:01&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-28 19:26:28&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-18 02:57:11&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-22 13:54:48&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-31 05:34:35&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-04-11 07:16:55&quot;,&quot;http_code&quot;:404},{&quot;date&quot;:&quot;2026-04-27 07:31:04&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-05-28 06:29:42&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-06-19 08:11:53&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-06-24 00:38:21&quot;,&quot;http_code&quot;:200}],&quot;broken&quot;:false,&quot;last_checked&quot;:{&quot;date&quot;:&quot;2026-06-24 00:38:21&quot;,&quot;http_code&quot;:200},&quot;process&quot;:&quot;done&quot;},{&quot;id&quot;:25,&quot;href&quot;:&quot;https:\\\/\\\/drive.google.com\\\/file\\\/d\\\/1q4gCFnd8RolnEONJ1AzD_XqWfrmnwfaR\\\/view?usp=sharing&quot;,&quot;archived_href&quot;:&quot;http:\\\/\\\/web-wp.archive.org\\\/web\\\/20251205103628\\\/https:\\\/\\\/drive.google.com\\\/file\\\/d\\\/1q4gCFnd8RolnEONJ1AzD_XqWfrmnwfaR\\\/view?usp=sharing&quot;,&quot;redirect_href&quot;:&quot;&quot;,&quot;checks&quot;:[{&quot;date&quot;:&quot;2026-01-07 07:21:32&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-01-29 05:36:13&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-09 09:16:23&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-16 00:09:02&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-28 19:26:28&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-18 02:57:11&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-22 13:54:48&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-31 05:34:35&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-04-11 07:16:55&quot;,&quot;http_code&quot;:404},{&quot;date&quot;:&quot;2026-04-27 07:31:05&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-05-28 06:29:41&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-06-19 08:11:53&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-06-24 00:38:21&quot;,&quot;http_code&quot;:200}],&quot;broken&quot;:false,&quot;last_checked&quot;:{&quot;date&quot;:&quot;2026-06-24 00:38:21&quot;,&quot;http_code&quot;:200},&quot;process&quot;:&quot;done&quot;}]\"><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Program 1 Lifestyle Health Risk Dataset Lifestyle Health Risk Dataset 1 import pandas as pd # For handling tabular data. import numpy as np #For numerical operations and random data generation. import matplotlib.pyplot as&#46;&#46;&#46;<\/p>\n","protected":false},"author":581,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[36],"tags":[19647,34962,34965,34964,34963,8431,34966,33127,33128,20697],"class_list":["post-146107","post","type-post","status-publish","format-standard","hentry","category-machine-learning","tag-k-means-clustering","tag-lifestyle-health-risk-prediction","tag-lifestyle-health-risk-prediction-project","tag-lifestyle-health-risk-prediction-using-k-means-clustering","tag-lifestyle-health-risk-prediction-using-machine-learning","tag-machine-learning","tag-machine-learning-lifestyle-health-risk-prediction-project","tag-machine-learning-practical","tag-machine-learning-program","tag-machine-learning-project"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.8 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>ML Project - Lifestyle Health Risk Prediction using K-means Clustering - DataFlair<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"ML Project - Lifestyle Health Risk Prediction using K-means Clustering - DataFlair\" \/>\n<meta property=\"og:description\" content=\"Program 1 Lifestyle Health Risk Dataset Lifestyle Health Risk Dataset 1 import pandas as pd # For handling tabular data. import numpy as np #For numerical operations and random data generation. import matplotlib.pyplot as&#046;&#046;&#046;\" \/>\n<meta property=\"og:url\" content=\"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/\" \/>\n<meta property=\"og:site_name\" content=\"DataFlair\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/DataFlairWS\/\" \/>\n<meta property=\"article:published_time\" content=\"2025-07-25T05:25:03+00:00\" \/>\n<meta name=\"author\" content=\"DataFlair Team\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DataFlairWS\" \/>\n<meta name=\"twitter:site\" content=\"@DataFlairWS\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"DataFlair Team\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"1 minute\" \/>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"ML Project - Lifestyle Health Risk Prediction using K-means Clustering - DataFlair","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/","og_locale":"en_US","og_type":"article","og_title":"ML Project - Lifestyle Health Risk Prediction using K-means Clustering - DataFlair","og_description":"Program 1 Lifestyle Health Risk Dataset Lifestyle Health Risk Dataset 1 import pandas as pd # For handling tabular data. import numpy as np #For numerical operations and random data generation. import matplotlib.pyplot as&#46;&#46;&#46;","og_url":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/","og_site_name":"DataFlair","article_publisher":"https:\/\/www.facebook.com\/DataFlairWS\/","article_published_time":"2025-07-25T05:25:03+00:00","author":"DataFlair Team","twitter_card":"summary_large_image","twitter_creator":"@DataFlairWS","twitter_site":"@DataFlairWS","twitter_misc":{"Written by":"DataFlair Team","Est. reading time":"1 minute"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/#article","isPartOf":{"@id":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/"},"author":{"name":"DataFlair Team","@id":"https:\/\/data-flair.training\/blogs\/#\/schema\/person\/c187795dc82ab948373cca526df7c445"},"headline":"ML Project &#8211; Lifestyle Health Risk Prediction using K-means Clustering","datePublished":"2025-07-25T05:25:03+00:00","mainEntityOfPage":{"@id":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/"},"wordCount":21,"commentCount":0,"publisher":{"@id":"https:\/\/data-flair.training\/blogs\/#organization"},"keywords":["K-means Clustering","lifestyle health risk prediction","lifestyle health risk prediction project","lifestyle health risk prediction using k-means clustering","lifestyle health risk prediction using machine learning","machine learning","machine learning lifestyle health risk prediction project","machine learning practical","machine learning program","machine learning project"],"articleSection":["Machine Learning Tutorials"],"inLanguage":"en-US","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/","url":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/","name":"ML Project - Lifestyle Health Risk Prediction using K-means Clustering - DataFlair","isPartOf":{"@id":"https:\/\/data-flair.training\/blogs\/#website"},"datePublished":"2025-07-25T05:25:03+00:00","breadcrumb":{"@id":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/data-flair.training\/blogs\/lifestyle-health-risk-prediction-using-machine-learning\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Blog Home","item":"https:\/\/data-flair.training\/blogs\/"},{"@type":"ListItem","position":2,"name":"Machine Learning Tutorials","item":"https:\/\/data-flair.training\/blogs\/category\/machine-learning\/"},{"@type":"ListItem","position":3,"name":"ML Project &#8211; Lifestyle Health Risk Prediction using K-means Clustering"}]},{"@type":"WebSite","@id":"https:\/\/data-flair.training\/blogs\/#website","url":"https:\/\/data-flair.training\/blogs\/","name":"DataFlair","description":"Learn Today. Lead Tomorrow.","publisher":{"@id":"https:\/\/data-flair.training\/blogs\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/data-flair.training\/blogs\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Organization","@id":"https:\/\/data-flair.training\/blogs\/#organization","name":"DataFlair","url":"https:\/\/data-flair.training\/blogs\/","logo":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/data-flair.training\/blogs\/#\/schema\/logo\/image\/","url":"https:\/\/data-flair.training\/blogs\/wp-content\/uploads\/sites\/2\/2016\/07\/Data-Flair.png","contentUrl":"https:\/\/data-flair.training\/blogs\/wp-content\/uploads\/sites\/2\/2016\/07\/Data-Flair.png","width":106,"height":48,"caption":"DataFlair"},"image":{"@id":"https:\/\/data-flair.training\/blogs\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/DataFlairWS\/","https:\/\/x.com\/DataFlairWS","https:\/\/www.linkedin.com\/company\/dataflair-web-services-pvt-ltd\/","https:\/\/www.youtube.com\/user\/DataFlairWS"]},{"@type":"Person","@id":"https:\/\/data-flair.training\/blogs\/#\/schema\/person\/c187795dc82ab948373cca526df7c445","name":"DataFlair Team","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/secure.gravatar.com\/avatar\/2302ebc438084d2f1f993edc1996a0aae01332e81f3227cba8df0c48ec010ca4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/2302ebc438084d2f1f993edc1996a0aae01332e81f3227cba8df0c48ec010ca4?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/2302ebc438084d2f1f993edc1996a0aae01332e81f3227cba8df0c48ec010ca4?s=96&d=mm&r=g","caption":"DataFlair Team"},"description":"DataFlair Team provides high-impact content on programming, Java, Python, C++, DSA, AI, ML, data Science, Android, Flutter, MERN, Web Development, and technology. We make complex concepts easy to grasp, helping learners of all levels succeed in their tech careers.","url":"https:\/\/data-flair.training\/blogs\/author\/dfteam6\/"}]}},"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/posts\/146107","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/users\/581"}],"replies":[{"embeddable":true,"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/comments?post=146107"}],"version-history":[{"count":3,"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/posts\/146107\/revisions"}],"predecessor-version":[{"id":146119,"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/posts\/146107\/revisions\/146119"}],"wp:attachment":[{"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/media?parent=146107"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/categories?post=146107"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/data-flair.training\/blogs\/wp-json\/wp\/v2\/tags?post=146107"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}