AI허브

정부가 구축해 운영 중.  AI 인프라 통합 플랫폼 ‘AI허브’의 규모가 가장 크다. 작년엔 공개 데이터 수가 약 5억 건이었지만 1년 만에 규모가 두 배 이상으로 늘었다. 지난 7월 기준 한국어·영상 이미지·헬스케어 등 381종에 걸쳐 데이터 약 11억 건을 공개하고 있다.

통합데이터 지도

무슨 데이터를 어디서 얻어야 할지 감이 잡히지 않는다면 ‘통합데이터 지도’를 활용할 수 있다. AI허브를 비롯해 국내 16대 빅데이터 플랫폼 등에 퍼져 있는 데이터를 검색할 수 있는 플랫폼이다. 데이터셋 분석 사례도 공개해 특정 모델에 필요한 데이터를 제시한다.

데이터셋

글로벌 정보기술(IT)기업 구글도 ‘데이터셋 검색’을 지원한다. 사전에 공유된 데이터셋 중 약 2500만 개를 미리 분류해 간단한 키워드만으로도 검색할 수 있게 했다.

캐글

구글의 AI 경진대회 플랫폼 ‘캐글’도 데이터 검색 기능을 지원한다.

'정보 > 빅데이터' 카테고리의 다른 글

세계 100대 기업  (0) 2023.01.01
가명정보 결합  (0) 2022.12.17
서울시 실시간 도시데이터 매뉴얼  (0) 2022.09.22
다크 데이터  (0) 2022.09.21
Data Analysis  (0) 2022.09.13

포랜직 유전계보학은 범죄 현장에서 발견된 유전자를 근거로 유사 유전자를 가진 사람들을 조사하여 범인을 추적하는 방법이다. 이 방법은 가계를 찾아감에 따른 시간적 비효율성이 높다는 것이다. 수학적 알고지즘을 이용하여 기존보다 10배 효율화 하는 방법이 스탠포드재 교수팀에 의해 개발되었다. 상세한 내용은 22년 9월 국제학술지 ‘법의학지’에 실렸다.

'정보 > 수학' 카테고리의 다른 글

스포츠 승리의 확률  (0) 2022.12.04
용어  (0) 2022.10.28
Fermi Questions  (1) 2022.09.14
Fermi problem 참고자료  (0) 2022.09.14
페르미 추정  (0) 2022.09.14

마술사 출신 수학자는 카지노의 허점을 어떻게 설명했나 - BBC News 코리아

 

https://www.google.com/url?cd=CAEYAyoUMTI4MTE2MjYzOTU0MDMzMDQ2MzYyHDc2MzVhMjAyZjdiOTNmNzc6Y28ua3I6a286S1I&ct=ga&rct=j&sa=t&url=https%3A%2F%2Fwww.bbc.com%2Fkorean%2F63324420&usg=AOvVaw1A2MbkmG32XmrJo0gA3Yxj

 

www.google.com

최소공배수

둘 이상의 자연수의 배수 중
공통적으로 겹치는 최초의 배수

 

리플 셔플

셔플은 카드를 섞는 것을 말한다. 셔플에는 리플셔플, 힌두셔플, 오버핸드 셔플이 있다.

 

마르코프 체인

과거 상태와는 독립적으로 현재 상태에 의해서만 결정된다는 것을 의미한다. 다른 말로 표현하면, 과거와 현재 상태 모두를 고려했을 때 미래 상태가 나타날 확률과 현재 상태만을 고려했을 때 미래 상태가 발생할 확률이 동일하다는 것이다

 

카드 카운팅

지금까지의 카드 수를 세어 어떤 카드가 남아있는지 체크하는 것이다.

 

무작위성 연구

'정보 > 수학' 카테고리의 다른 글

스포츠 승리의 확률  (0) 2022.12.04
포렌직 유전 계보학 효율화 알고리즘  (0) 2022.11.05
Fermi Questions  (1) 2022.09.14
Fermi problem 참고자료  (0) 2022.09.14
페르미 추정  (0) 2022.09.14

서울시 실시간 도시데이터 매뉴얼

실시간 도시데이터 매뉴얼.pdf
2.19MB

'정보 > 빅데이터' 카테고리의 다른 글

세계 100대 기업  (0) 2023.01.01
가명정보 결합  (0) 2022.12.17
무료 데이터 플랫폼  (0) 2022.11.07
다크 데이터  (0) 2022.09.21
Data Analysis  (0) 2022.09.13

카이스트 - 우리가 모르는 데이터 (내용의 정리)

Dark Matter의 개념으로부터 유래하였다.

암흑물질의 존재 없이 은하 바깥 쪽의 별들이 은하 중심부의 별들보다 천천히 움직이는 현상을 설명할 수 없다. 다크 데이터는 우리가 볼 수 없고 기록되지 않지만, 우리의 결정과 행동에 막대한 영향을 미칠 수 있는 데이터를 말한다.

 

다크 데이터 생성 원인

데이브드 핸드는 다크 데이터를 15가지로 분류하였다.

1. 데이터 세트를 생성하는 방법에 따른 것. 데이터 수집에 흔히 설문조사를 사용한다. 무작위와 적절한 선정 하더라도,  일부 질문에 대한 답과 설문 조사 불참여 등에 따른 문제로 발생할 수 있다. 

2. 수집 과정에서의 문제. 누락된 데이터에 의한 오해가 있을 수 있다.

3. 기타. 인간으로서의 오류, 측정 오류, 고의 은닉, 비대칭적 정보 제공.

 

다크 데이터의 이용

완전사례분석 방법. 완전한 데이터 실패 시, 데이터가 왜 빠졌는지를 이해하고 대체 방법을 찾는다.

데이터 삽입법 _ 대치법(imputation)

- 평균 대치법

- 댜중 대치법

 

-------------------------------------------------------------------------------------------------------

카이스트 - 우리가 모르는 데이터

2007년 인터넷 경매 사이트인 이베이에 1852년산 아크틱 에일(Arctic ale) 한 병이 올라왔습니다. 올소프(Allsopp)라는 양조업자가 준비한 술로, 북극 원정을 떠난 탐험가들에게 제공되던 맥주였습니다. 산뜻한 갈색에 포도주와 견과 맛이 동시에 나는 좋은 술이었죠. 그런데 판매자는 이베이에 글을 올리면서 한 가지 실수를 저질렀습니다. 올소프의 두 p에서 하나를 빼먹고 만 겁니다! 그 결과 대다수의 빈티지 맥주 애호가들은 아크틱 에일을 검색하지 못했고, 우덜이라는 청년이 고작 304달러에 맥주를 낙찰 받게 되었습니다. 우덜은 맥주의 진짜 가치를 알아보고 싶어 곧바로 이베이에 글을 올렸습니다. 이번에는 철자를 제대로 적었죠. 그러자 157건의 입찰이 있었고, 최종 낙찰가는 무려 50,300달러였습니다. 우리는 이 사례를 통해 빠진 정보가 얼마나 중요한 차이를 만들어낼 수 있는지 알 수 있습니다. 그렇다면 우리가 모르는 데이터에는 어떤 것들이 있고, 왜 중요할까요?

 

우리가 알지 못하는 데이터

 우리가 모르는 데이터를 부르는 명칭이 있습니다. 바로 ‘다크 데이터(dark data)’입니다. 다크 데이터라는 용어는 암흑물질(dark matter)에서 유래했습니다. 우주의 약 27%를 차지하는 이 불가사의한 물질은 다른 전자기파와 상호작용하지 않아서 육안으로 관측할 수 없습니다. 하지만 암흑물질의 존재 없이는 은하 바깥쪽의 별들이 은하 중심부의 별들보다 천천히 움직이지 않는 현상을 설명할 수 없었습니다. 중력이론을 통해 예측한 결과와는 상이했죠. 다크 데이터도 암흑물질과 비슷합니다. 우리가 볼 수도 없고 기록되지도 않지만, 우리의 결정과 행동에 막대한 영향을 미칠 수 있습니다. 미지의 데이터가 숨어있을 가능성을 알아차리지 못한다면 치명적인 결과를 낳을 수도 있죠. 따라서 지금부터는 다크 데이터가 왜 생겨나는지 알아보도록 합시다. 

 

다크 데이터는 왜 생겨나는가?

 다크 데이터가 생겨나는 원인은 무수히 많습니다. 여기서는 그중 몇 가지를 소개하고자 합니다.

 먼저, 데이터 세트를 생성하는 방법에 따라 다크 데이터가 발생할 수 있습니다. 모집단 내의 일부 항목에 대해서만 데이터를 수집할 때, 가장 흔히 사용되는 전략에는 설문조사가 있습니다. 설문조사를 실시할 때는 표본을 무작위로, 적절히 뽑아야 합니다. 다행스럽게도 큰 수의 법칙에 따르면, 한 모집단에서 무작위로 뽑은 표본의 평균값은 표본이 충분히 크다는 가정하에 모집단의 진짜 평균값에 근접할 확률이 매우 높습니다. 하지만 설문조사에서도 다크 데이터는 발생합니다. 설문조사는 대체로 자발적인 참여에 의존합니다. 사람들은 어떤 질문에는 대답하고, 어떤 질문에는 대답하지 않거나, 설문조사에 참여하지 않을 수 있습니다. 이때 빠진 응답들은 다크 데이터가 됩니다.

 데이터를 수집하는 과정에서도 다크 데이터가 발생합니다. 타이태닉호의 비극에 관해서는 누구나 들어본 적이 있을 겁니다. 타이태닉호에는 승무원이 908명 있었는데, 그중 23.3%인 212명만이 생존했습니다. 반면 삼등칸 승객 627명 중에서는 24.1%인 151명이 생존했습니다. 이 데이터만 본다면 삼등칸 승객이 승무원보다 많이 생존했다는 결론을 내리게 됩니다. 그러나 이를 생물학적 성별로 나누어 보면 새로운 결과를 얻게 됩니다. 승무원 중에 남성은 885명이었고, 이들 중에서는 21.7%인 192명이 생존했습니다. 삼등칸 남성 승객은 462명이었으며 16.2%인 75명이 생존했죠. 이 분석에 따르면 남성 승무원의 생존율이 더 높습니다. 여성도 마찬가지입니다. 여성 승무원은 23명이었고, 87.0%인 20명이 생존했지만, 삼등칸 여성 승객 165명중에서는 46.1%인 76명이 생존했습니다. 이 경우에도 여성 승무원의 생존율이 더 높습니다. 어떻게 된 것일까요? 수치가 보여주듯, 이는 속임수가 아닙니다. 이 현상은 ‘심슨의 역설’이라고 불립니다. 만약 배에 탄 사람들의 성별을 기록해두지 않았다면 삼등칸 승객의 생존율이 더 높다는 결론을 내리겠지만, 성별에 초점을 맞춘다면 이는 틀린 분석이 됩니다. 데이터 각각이 갖는 특성 중 하나라도 결론을 뒤집는 효과를 낸다면 특성이 누락된 데이터는 오해의 소지를 불러일으킬 수 있습니다.

 이 밖에도 인간이기 때문에 발생할 수밖에 없는 오류나 측정 도구의 오류, 고의로 은닉되거나 비대칭적으로 제공되는 정보로 인해 다크 데이터가 발생하기도 합니다. 그렇다면 이렇게 생겨난 다크 데이터의 종류에는 정확히 어떤 것들이 있을까요?

 

다크 데이터의 15가지 유형

 데이비드 핸드는 다크 데이터의 유형을 총 15가지로 분류했습니다. 하지만 이 분류법도 다크 데이터의 모든 유형을 설명하지는 못합니다. 데이터가 누락되거나 부적절해지는 원인은 무수히 많고, 새로운 유형의 데이터는 계속 생겨나고 있기 때문입니다. 지금부터는 한 가지 비극적인 사건을 통해 몇 가지 유형을 살펴보겠습니다.

 1986년 1월 28일, 우주왕복선 챌린저호가 발사 후 73초 만에 15킬로미터 상공에서 거대한 불덩어리로 변해 추락하고 말았습니다. 추진 로켓 중 하나가 폭발했기 때문이었습니다. 이 사고로 우주비행사 다섯 명과 임무 수행 전문가 두 명으로 구성된 승무원 일곱 명이 모두 사망했습니다. 비극적인 사고 전날 밤, 로켓 추진체를 만든 모턴 사이어콜 사와 마셜우주비행센터에 있던 직원들은 원격 회의를 진행하고 있었습니다. 마셜우주비행센터의 한 직원이 모턴 사이어콜 측에 낮은 온도가 고체 로켓 모터에 어떤 영향을 미칠지 점검해 달라고 부탁했습니다. 그러자 모턴 사이어콜 팀은 낮은 온도에서는 오링(O-ring)이라는 부품이 딱딱해질 것이라고 답변했습니다. 오링은 네 개의 구성부로 만들어진 로켓 추진체의 접합 부분을 연결할 때 사용하는 부품으로, 모턴 사이어콜 측에서는 오링이 딱딱해지면 접합부 사이의 틈이 벌어지면서 로켓 추진체 사이의 밀폐력이 손상될 것을 우려했습니다. 그러나 오링 변형이 일어난 비행의 데이터를 살펴 보았을 때는 발사 온도와 오링 변형 사이에 큰 관련이 없어 보였습니다. 발사 일자에 대한 압박을 느끼고 있었던 직원들은 고민하다가 발사를 해도 좋다는 결론을 내렸습니다. 사고 후 조사위원회는 한 가지 사실에 주목했습니다. 오링 변형을 겪은 적이 없는 비행들은 원격 회의에서 논의되지 않았던 겁니다.

 이는 핸드가 구분한 유형 중 유형 2번인 ‘빠져 있는지 우리가 모르는 데이터’와 3번인 ‘일부 사례만 선택하기’에 해당합니다. 빠져 있는지 우리가 모르는 데이터는 누락된 데이터의 존재를 알아차리지 못하는 경우로, 예상 응답자 목록을 모르는 채로 진행한 인터넷 설문조사 등이 대표적인 사례입니다. 챌린저호의 사례에서 직원들은 해당 데이터가 누락됐다는 사실을 모르고 있었죠. 또한, 일부 사례만 선택하기는 데이터를 표본에 포함하는 기준을 잘못 선택하거나, 과학적 데이터에 대해 p-해킹* 등을 감안하지 못했을 때 발생하는 다크 데이터의 유형입니다. 챌린저호의 사례에서는 오링 변형을 겪은 적이 없는 비행들을 표본에 포함하지 않았습니다.

 조금 더 살펴봅시다. 챌린저호 발사 시 접합부의 온도 스펙트럼인 화씨 53도와 75도 사이에서 변형된 오링의 개수는 관련성을 보이지 않습니다. 과거 가장 낮은 발사 온도인 화씨 53도에서는 오링 4개 중 3개가 변형을 일으켰지만, 가장 높은 발사 온도인 화씨 75도에서는 2개가 변형을 일으켰습니다. 하지만 여기에 오링 변형이 없었던 발사를 포함하면 양상이 달라집니다. 온도가 화씨 65도 아래였던 모든 발사에서는 오링 변형이 일어났지만, 더 높은 온도에서 실시된 21번의 발사 중에서는 변형이 4번밖에 일어나지 않았습니다. 따라서 발사 온도가 낮을수록 위험성이 더 커졌던 것이죠. 이는 유형 15번, ‘데이터 너머로 외삽하기’의 예입니다. 데이터 세트는 언제나 유한할 수밖에 없습니다. 최댓값과 최솟값 밖의 데이터들에 관해서 말하려면 다른 정보가 필요합니다. 챌린저호는 기존의 데이터들보다 한참 낮은 온도인 화씨 31도가량에서 발사되었고, 이는 가지고 있던 최솟값을 벗어나는 데이터였습니다.

 

다크 데이터를 어떻게 이용하는가?

 그렇다면 여러분은 이제 이렇게 말할지도 모릅니다. 우리 주변에 다크 데이터가 그렇게 많다면, 다크 데이터에 어떻게 대처해야 하나요? 다크 데이터를 이용할 수는 없나요? 지금부터는 빠진 데이터를 이용하는 방법을 알아보겠습니다.

 먼저 데이터가 빠져 있는 상황을 가정해봅시다. 전체 데이터를 얻는 데 실패했다면, 다음으로 할 수 있는 일은 데이터가 왜 빠졌는지를 이해하고, 대체할 방법을 찾는 것입니다. 하나의 방법으로는 모든 특성에 대한 측정값이 있는 데이터만을 이용하는 방법입니다. ‘완전사례분석’이라고 불리는 이 방법은 데이터가 누락될 확률이 관찰되거나 관찰되지 않은 데이터와 아무런 연관성이 없다고 가정할 경우 타당합니다. 하지만 불완전한 데이터만 존재한다면 사용할 수 없는 방법이기도 합니다. 또 하나의 방법은 우리가 가진 모든 데이터를 사용하여 빠진 값을 추산하는 것입니다. 100개의 응답 중 나이가 기록된 응답이 96개라면, 이 96개의 응답만을 이용해 평균 나이를 추산하는 방법입니다. 그러나 누락된 값들이 기록된 값들과 눈에 띄게 다르다면 이 방법을 사용할 수 없습니다. 세 번째 전략은 어떤 특성들이 빠졌는지에 따라 기록을 분류한 뒤 분석하는 방법입니다. 가령 기록에서 나이가 빠진 사람들은 나이가 기록된 사람들과 별도로 분류하여 분석할 수 있습니다. 하지만 이 방법은 하나의 요약된 결론을 내기는 어렵습니다. 마지막 방법은, 그저 인내심을 가지고 빠진 데이터를 지속해서 조사하는 방법입니다. 슬프게도 언제나 가능한 방법은 아니죠.

 그렇다면 데이터를 채워 넣는 방법은 어떨까요? 이렇게 빠진 값들을 대신할 값을 삽입해 데이터를 완성하는 전략을 대치법(imputation)이라고 합니다. 가장 흔한 대치법 중 하나는 빠진 값을 기록된 값들의 평균으로 대체하는 평균 대치법입니다. 그러나 빠진 값들의 경향이 다를 가능성을 무시할 수 없고, 실제로 값들이 모두 동일할 가능성도 몹시 낮습니다. 이를 대신할 방법으로 다중 대치법이 있습니다. 대치법의 문제는 대치되는 값을 바꿀 때마다 다른 결과가 나오는 것입니다. 다중 대치법은 오히려 이러한 점을 이용하여, 서로 다른 대치 값들을 이용해 대치를 여러 번 반복한 뒤, 완전해진 데이터 세트 각각에 대한 요약 통곗값들의 분포를 얻어냅니다. 그런 다음 요약 통계의 불확실성이나 분산과 같은 매개변수를 추산하여, 그 분포가 가질 수 있는 값들이 얼마나 확실한지 알아냅니다. 이 전략은 빠진 데이터 문제를 공략하기 위해 널리 사용되어 왔습니다.

 

 다크 데이터는 단점만 있는 것처럼 보입니다. 물론 우리는 다크 데이터를 경계해야 합니다. 하지만 우리가 신중하기만 하다면 앞서 소개한 몇 가지 방법처럼 값이 누락된 데이터를 이용하거나, 결정을 내릴 때 이롭게 사용할 수 있는 방법도 존재합니다. 그러니 끊임없이 질문합시다. “우리가 모르는 데이터가 무엇일까?”

https://times.kaist.ac.kr/news/articleView.html?idxno=20960http://times.kaist.ac.kr)

'정보 > 빅데이터' 카테고리의 다른 글

세계 100대 기업  (0) 2023.01.01
가명정보 결합  (0) 2022.12.17
무료 데이터 플랫폼  (0) 2022.11.07
서울시 실시간 도시데이터 매뉴얼  (0) 2022.09.22
Data Analysis  (0) 2022.09.13

Fermi Problems: Solve Them If You Dare...
1. How many frames are in a Walt Disney animated movie such as Tarzan?

월트 디즈니 애니메이션 영화는, 예를 들어 타잔의 경우, 얼마나 많은 프레임으로 만들어 졌을까?


2. What is the mass of a fully loaded cement truck?

시멘트 트럭의 체적은 완전히 적재 되었을 때 얼마나 될까?


3. What is the mass of a fully loaded Boeing 747?

보잉 747의 체적은 얼마나 될 것인가?


4. If you were to stack a pile of one dollar bills corresponding to the US national debt,

1불 지폐로 미국 부태를 쌓을 때, 얼마나 될 것인가?
A. how high would it reach?

그 높이는?


B. how much would it weigh?

그 무게는?
C. what would be the pressure on the bottom dollar?

맨 밑바닥 달러에 미치는 압력은?
5. What is the length in miles of the US Interstate Highway system?

미국 고속도로의 총 연장은 얼마나 될 것인가?


6. How many molecules come off a car tire with each revolution?

자동차 바퀴가 한 바퀴 돌때 마다, 떨어져 나가는 분자의 개수는?


7. How many gallons of water move down the Mississippi River in one day?

하루에 미시피 강을 흐르는 물의 량은 얼마나 될까?
8. How many piano tuners would you expect to find in the local telephone directory?

지역 전화번호부에서 발견할 수 있는 피아노 조율사의 숫자는?


9. How much energy is released due to latent heat of vaporization when a hurricane dumps 16 inches
of rain on North Carolina?

16인치의 비를 노스 케로라이나에 허리케인이 뿌릴 때 기화에 의하여 빼앗기는 잠열의 에너지 총량은 얼마나 될까?


10. If a high explosive (e.g. TNT) releases as much energy per kilogram as food, how many people would the
energy of a 1-MT H-bomb feed for one day, if its energy could be converted to food at 100% efficiency?

폭약이 방출하는 에너지를 음식으로 환원할 경우 1메가톤의 폭탄으로 얼마나 많은 사람을 먹일 수 있을 것인가?


11. How many square kilometers of surface would it take to supply the U.S. with all its energy needs if solar
energy could be converted with 1% efficiency? Allow for night time, cloud cover, etc. The solar constant
is 1.35 kW/m2.

태양 에너지의 1%를 에너지로 만들 수 있을 경우 미국에서 필요한 모든 에너지를 충족하기 위해 얼마나 많은 면적이 필요할 것인가? 밤, 구름에 의한 문제를 고려한다. 1.35 kW/m2.의 태양에너지가 비추는 것을 가정한다.


12. If all the oxygen atoms breathed by Enrico Fermi over his lifetime are now distributed uniformly through the
atmosphere, how many of these atoms do you breathe in with each breath?

엔리코 페르미가 평생 마신 산소 분자가 대기에 균일하게 퍼져 있다고 가정할 때, 우리는 매번 숨쉴때 마다 얼마나 많은 이들 분자를 호흡하고 있을 것인가?


13. If you could get a penny for each time someone said "Ouch!" in the United States, how long would it take you to become a billionaire?

미국에서 누군가 아우치라고 이야기 할 때 페니를 받는다면, 빌리온에어가 되기 위하여 얼마의 시간이 필요할 것인가?


14. If all the ball-bearings in all the fishing reels in the U.S. were dumped into a single grain elevator silo, how tall
would the silo have to be?
15. If we used ALL the electrical energy in the world to operate motor that could slow down the earth with 1% efficiency,
how many days (as measured by Earth rotations) would it take to bring the rotation of the Earth to a halt?
16. Pick a nearby tree. Estimate the number of leaves on the tree.
17. Assuming that energy is transferred with 100% efficiency, how much soup could be heated up from room temperature to "hot soup eating temperature" by making use of all of the energy expended in playing a game of pool? Note: This problem was devised a few meters from the pool tables at the Reynolds Club at the University of Chicago, which is not far from the old squash courts. If you don't know the significance of the U of C squash courts to physics, look it up!

 

General

  1. Estimate the total number of hairs on your head. 당신의 머리카락 개수를 추정하시오.
  2. Estimate the number of square inches of pizza consumed by all the students at the University of Maryland during one semester. 한 학기 동안 메릴랜드 대학의 모든 학생들이 소비하는 피자의 면적을 계산하시오.
  3. When it rains, water would accumulate on the roofs of flat-topped buildings if there were no drains. A heavy rain may deposit water to a depth of an inch or more. Given that water has a mass of about 1 gm/cm 3 , estimate the total force the roof of the physics lecture hall would have to support if we had an inch of rain and the roof drains were plugged. 지붕 위에 비가 내렸다고 가정하고, 비가 온 채로 고였을 경우 어떤 걸물에 1인치 비가 내렸을 경우, 얼마의 무게를 견뎌야 할 것인가? 물의 무게는 1 gm/cm 3로 가정한다.
  4. One suggestion for putting satellites into orbit cheaply without using rockets is to build a tower 300 km high containing an elevator. One would put the payload in the elevator, lift it to the top, and just step out into orbit. Ignoring other problems (such as structural strain on the tower), estimate the weight of such a tower if its base were the size of Washington DC and it were made of steel. (Steel is about 5 times as dense as water, which has a density of 1 gm/cm 3 .)
  5. Estimate the total amount of time 19 year olds in the US spent during this past semester studying for exams in college. (Not counting finals.)
  6. The deficit in the Federal Budget this past year was approximately $100 Billion ($10 11 ). (a)Assuming this was divided equally to every man, woman, and child in the country, what is your share of the debt?
    (b) Supposing the deficit were paid in $1 bills and they were layed out on the ground without overlapping. Estimate what fraction of the District of Columbia could be covered.
    (c) Suppose you put these $1 bills in packages of 100 each and gave them away at the rate of 1 package every 10 seconds. If you start now, when will you be finished giving them away?
    (d) Are any of these calculations relevant for a discussion which is trying to understand whether the deficit is ridiculously large or appropriate in scale? Explain your reasoning.
  7. The Federal Budget Deficit is approximately $100 Billion this year. Compare this to what we spend on what we eat by estimating the total amount US consumers spend on food in grocery stores, markets, and restaurants in one year.
  8. In the 1989 Loma Prieta earthquake in California, approximately 2 million books fell off the shelves at the Stanford University library. If you were the library administrator and wanted to hire enough part-time student labor to put the books back on the shelves in order in 2 weeks, how many students would you have to hire? (You may assume that the books just fell off the shelves and got a bit mixed up but books in different aisles did NOT get shuffled together.)
  9. Estimate the total number of sheets of 8.5 x 11 inch paper used by all the students at the University of Maryland in one semester.
  10. If the land area of the earth were divided up equally for each person on the planet, about how much would you get?
  11. After the gulf war, large areas of desert had to be cleared of mines using special bulldozers that simply sweep the sand in front of them like a snowplow, but whose blades are strong enough to withstand the explosion of a mine. Estimate how long it would take a single bulldozer to clear a patch of desert that is 10 km square.
  12. This winter, the East coast has been hit by a number of snow storms. Estimate the amount of work a person does shoveling the walk after a snow storm. Among your estimates you may take the following:
    • The length of a typical path from a house to the street is 10 meters.
    • Assume the snow fell to a depth of 4 inches.
    • Assume the snow was only moderately packed so that its density was equal to 0.2 g/cm 3 -- about one fifth that of water.
    In doing this problem, you should estimate any other numbers you need to one significant figure. Be certain to state what assumptions you are making and to show clearly the logic of your calculation. (In this problem, the answer is only worth 2 points. Almost all of the credit is given for your showing correct reasoning clearly.)
  13. A floppy disk for a computer stores information by magnetizing small regions of the disk. For a typical floppy disk, estimate the area of the disk that corresponds to a single bit of information. (Remember: the storage capacity of a disk is cited in bytes where 1 byte = 8 bits.)
  14. Ali El-Ectrical is an Engineering student at your university taking a "normal" load (for Engineers!) and paying full tuition. Estimate how much he is paying for each hour of class time he spends with an instructor over one semester.
  15. Estimate the number of blades of grass a typical suburban house's lawn has in the summer.
  16. How many notes are played on a given radio station in a given year?
  17. How many pencils would it take to draw a straight line along the entire Prime Meridian of the earth?
  18. If all the string was removed from all of the tennis rackets in the US and layed out end-to-end, how many round trips from Detroit to Orlando could be made with the string?
  19. How many drops of waters are there in all of the Great Lakes. 호수에 있는 물방울의 개수는?
  20. How many piano tuners are there in New York? 뉴욕에 있는 피아노 조율사의 수는?
  21. How many atoms are there in the jurisdiction of the continental US?
  22. How far can a crow fly without stopping?
  23. How many golf balls can be fit in a typical suitcase? 가방에 들어갈 수 있는 골프공의 개수는?
  24. How tall is this building? 이 건물의 높이는?
  25. Estimate the number of cars and planes entering the state at any given time.
  26. How much air (mass) is there in the room you are in? 이 방 안에 있는 공기의 체적은?
  27. How long does it take a light bulb to turn off?
  28. ow much energy does it take to split a 2x4?
  29. How much milk is produced in the US each year? 미국에서 생산되는 우유의 총량은?
  30. If you drop a pumpkin from the top of a ten story building what is the farthest a single pumpkin seed can land from the point of impact?
  31. How many flat tires are there in the US at any 1 time?

Mechanics

  1. Estimate the angular momentum that your body has as a result of the earth's turning on its axis.
  2. The mass of the earth is about 6x10 24 kg. Estimate the kinetic energy it has as a result of its orbiting the sun.
  3. A professor of physics is going ice skating for the first time. He has gotten himself into the middle of an ice rink and cannot figure out how to make the skates work. Every motion he makes simply slips on the ice and leaves him in the same place he started. He decides that he can get off the ice by throwing his gloves in the opposite direction.
    (a) Suppose he has a mass M and his gloves have a mass m. If he throws them as hard as he can away from him, and they leave his hand with a velocity v. Explain whether or not he will move. If he does move, calculate his velocity, V.
    (b) Discuss his motion from the point of view of the forces acting on him.
    (c) If the ice rink is 10 m in diameter and the skater starts in the center, estimate how long it will take him to reach the edge, assuming there is no friction at all.
  4. The orbiting Hubble telescope was recently repaired by a crew of astronauts from the Space Shuttle Endeavor. The Hubble is in a circular orbit 600 km above the surface of the earth. For half of the Hubble's orbital period it is in sunlight and for half it is in the darkness of the earth's shadow. As a results of the change in fit of the various parts of the Hubble due to heating and cooling of the telescope, the astronauts could only work on certain repairs while the Hubble was in darkness. Estimate how much time the astronauts had to work on these repairs before having to stop "for a sun-break".
  5. According to Newton's law of universal gravitation, the earth's gravity gets weaker as we go further from the earth. But when we drop a ball near the top of the lecture hall it doesn't seem to fall any differently than we drop it near the floor. Let g t stand for the gravitational acceleration observed at the top of the lecture hall and g b for it at the bottom. Estimate how much Newton's universal gravitation theory predicts g t will be less than g b . (Hint: It's easier if you estimate the fractional change, g b /g t - 1.)
  6. Suppose the Army Corps of Engineers decided to put a dam across the Potomac River in order to provide power for the Washington area. Assume the dam was built to hold back the water into a lake to a height of 15 m behind the dam. (Ignore the fact that this lake would cover land occupied by houses and cities.) Estimate the total force the water would exert on the dam. (Hint: If you have never seen the Potomac and have no idea as to how wide it is across, make a reasonable guess.)
  7. A ballistic rocket is shot straight up from Cape Canaveral. Its rockets fire briefly. After the firing, it has it a velocity of 8 km/sec and a mass of m. How far up will it go before it begins to fall back to earth? Calculate your answer to within 10%. Ignore the distance it travels while its rockets are firing, the resistance of the atmosphere, and the rotation of the earth. (Hint: If you don't remember the radius of the earth you can solve for d/R e where d is the distance it reaches measured from the center of the earth and R e is the radius of the earth.)
  8. For next year's Physics Open House the Department is planning to set up a bungee jump from the top of the physics building. Assume that one end of an elastic band will be firmly attached to the top of the building and the other to the waist of a courageous participant. The participant will step off the edge of the building to be slowed and brought back up by the elastic band before hitting the ground (we hope). Estimate the length and spring constant of the elastic you would recommend using.
  9. Estimate the angular momentum an automobile tire has about its axis of rotation while the car is driving on the interstate.
  10. In testing a design for a yo-yo, an engineer begins by constructing a simple prototype -- a string wound about the rim of a wooden disk. She puts an axle riding on nearly frictionless ball bearings through the axis of the wooden disk and fixes the ends of the axle. In order to measure the moment of inertia of the disk, she attaches a weight of mass m to the string and measures how long it takes to fall a given distance. (a) Assuming the moment of inertia of the disk is given by I, and the radius of the disk is R, find the time for the mass to fall a distance h starting from rest.
    (b) She doesn't have a very accurate stopwatch but wants to get a measurement good to a few percent. She decides a fall time of 2 seconds would work. How big a mass should she use? Imagine you were setting up this experiment and make reasonable estimates of the parameters you need.
  11. According to some recent highly accurate measurements made from satellites, the continent of North America is drifting at a rate of about 1 cm per year. Assuming a continent is about 50 km thick, estimate the kinetic energy the continental US has a a result of this motion.
  12. While on travel this past summer, I passed through Charles deGaulle airport in Paris, France. The airport has some interesting devices, including a "people mover" -- a moving strip of rubber like a horizontal escalator without steps. It became interesting when the mover entered a plastic tube bent up at an angle to take me to the next terminal. I managed to get a photograph of it. It is shown in the figure below. If you were building this people mover for the architect, what material would you choose for the surface of the moving strip? (Hint: You want to be sure that people standing on the strip do not tend to slide down it. Figure out what coefficient of friction you need to keep from sliding down and then look up coefficients of friction in tables in reference books in the engineering library to get a material appropriate for the slipperiest shoes.) 
  13. Estimate the angular momentum of the earth due to its daily rotation about its axis. The average density of the earth is about 5 grams/cm3. Estimate the angular momentum of the earth due to its daily rotation about its axis. The average density of the earth is about 5 grams/cm3.

    

 

you can have these type of in the following books for reference.
"How Much is a Million" by David Schwartz
"Meta magical Themas" by Douglas Hofstadter
"Innumeracy" by John Allen Paulo's
"Used Math" by Clifford E. Schwartz
"Aha" and "Aha - Gotcha!" by Martin Gardner Thanks

'정보 > 수학' 카테고리의 다른 글

포렌직 유전 계보학 효율화 알고리즘  (0) 2022.11.05
용어  (0) 2022.10.28
Fermi problem 참고자료  (0) 2022.09.14
페르미 추정  (0) 2022.09.14
수학과 고고학  (0) 2022.09.13

기본 자료

문제 해결 전략

Applying the Fermi Estimation Technique to Business Problems

 

 

'정보 > 수학' 카테고리의 다른 글

포렌직 유전 계보학 효율화 알고리즘  (0) 2022.11.05
용어  (0) 2022.10.28
Fermi Questions  (1) 2022.09.14
페르미 추정  (0) 2022.09.14
수학과 고고학  (0) 2022.09.13

정확하게 파악하기 힘들거나, 예측이 어려운 수치에 대해, 논리적 사고를 이용하여 대략적 근사치를 추정하는 것.

이탈리아 출신 물리학자이자 노벨상 수상자인 엔리코 페르미가 제안한 방식.

페르미 추정으로 알고 싶은 것은 그 결과의 정확성이 아닙니다. 논리의 절차를 만들어 생각할 수 있느냐가 핵심입니다. 그리고 여기서 사용되는 방법도 역시 ‘평균값 변환’입니다.

숫자 감각의 힘. p79-81

'정보 > 수학' 카테고리의 다른 글

포렌직 유전 계보학 효율화 알고리즘  (0) 2022.11.05
용어  (0) 2022.10.28
Fermi Questions  (1) 2022.09.14
Fermi problem 참고자료  (0) 2022.09.14
수학과 고고학  (0) 2022.09.13

+ Recent posts