<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arne Hendrik Schulz</title>
	<atom:link href="http://www.ahschulz.de/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.ahschulz.de</link>
	<description></description>
	<lastBuildDate>Wed, 14 Mar 2012 19:39:05 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Infografik: Schlecker schließt 2.000 Läden</title>
		<link>http://www.ahschulz.de/2012/03/14/infografik-schlecker-schliest-2-000-laden/</link>
		<comments>http://www.ahschulz.de/2012/03/14/infografik-schlecker-schliest-2-000-laden/#comments</comments>
		<pubDate>Wed, 14 Mar 2012 15:25:58 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[Visualisierung]]></category>
		<category><![CDATA[gadm]]></category>
		<category><![CDATA[ggplot2]]></category>
		<category><![CDATA[Infografik]]></category>
		<category><![CDATA[Infomap]]></category>
		<category><![CDATA[Map]]></category>
		<category><![CDATA[Schlecker]]></category>
		<category><![CDATA[visualization]]></category>

		<guid isPermaLink="false">http://www.ahschulz.de/?p=234</guid>
		<description><![CDATA[Heute hat Schlecker angekündigt, infolge der Insolvenz 2.000 ihrer 5.400 Drogeriemärkte zu schließen. Die Liste der betroffenen Filialen ist öffentlich einsehbar. Auf ndr2 habe ich gerade übrigens gehört, dass die Liste noch nicht endgültig sei. Wie dem auch sei, ich &#8230; <a href="http://www.ahschulz.de/2012/03/14/infografik-schlecker-schliest-2-000-laden/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;">Heute hat Schlecker angekündigt, infolge der Insolvenz 2.000 ihrer 5.400 Drogeriemärkte zu schließen. <a href="http://schlecker-blog.com/2012/03/informationen-zu-schliesungen/" target="_blank">Die Liste der betroffenen Filialen ist öffentlich einsehbar.</a> Auf ndr2 habe ich gerade übrigens gehört, dass die Liste noch nicht endgültig sei. Wie dem auch sei, ich habe mir heute vormittag eine Kopie der Liste besorgt und auf dieser Basis eine kleine Infografik erstellt.</p>
<p style="text-align: left;">Wie weiter ersichtlich wird, werden vor allem in Ballungsgebieten Geschäfte geschlossen, hier insbesondere Berlin, Hamburg und Nordrhein-Westfalen. <a href="http://www.morgenpost.de/berlin-aktuell/article1927553/Schlecker-schliesst-ein-Drittel-der-Berliner-Filialen.html" target="_blank">In Berlin soll jede dritte Filiale wegfallen.</a> Ähnliches scheint auf die Regionen um Frankfurt und Stuttgart zuzutreffen.  Im Kontrast dazu sind Mecklenburg-Vorpommern, Brandenburg, das östliche Niedersachen und das westliche Rheinland-Pfalz relativ unbelastete Flecken.</p>
<p style="text-align: left;">Leider habe ich keine Liste mit allen Schleckerfilialen gefunden, sodass die geschlossenen Filialen nicht ins Verhältnis mit den weiterhin bestehenden Geschäften gesetzt werden kann.</p>
<p style="text-align: left;"><a href="http://www.ahschulz.de/wp-content/uploads/2012/03/schlecker_closing_big.png"><img class="aligncenter size-full wp-image-237" title="schlecker_closing" src="http://www.ahschulz.de/wp-content/uploads/2012/03/schlecker_closing.png" alt="" width="500" height="700" /></a>Die ursprüngliche Liste mit Ort und Straße der einzelnen Filialen wurde in R eingelesen und über Google mit den ensprechenden Koordinaten kodiert. 77 Filialen konnten dabei nicht identifiziert werden. Der gesamte Code findet sich hier: <a href="https://github.com/ahs85/schlecker_closings" target="_blank">https://github.com/ahs85/schlecker_closings</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2012/03/14/infografik-schlecker-schliest-2-000-laden/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Plotting German municipalities using Twitter</title>
		<link>http://www.ahschulz.de/2011/08/12/plotting-german-municipalities-using-twitter/</link>
		<comments>http://www.ahschulz.de/2011/08/12/plotting-german-municipalities-using-twitter/#comments</comments>
		<pubDate>Fri, 12 Aug 2011 10:03:29 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[Visualisierung]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=162</guid>
		<description><![CDATA[More and more institutions do use social networks in Germany, including Twitter. This belongs to municipalities, too. Getting back to a idea of Claas Hanken (a ex-collegue of mine), wanted to visualize these ones. The result can be seen in &#8230; <a href="http://www.ahschulz.de/2011/08/12/plotting-german-municipalities-using-twitter/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>More and more institutions do use social networks in Germany, including Twitter. This belongs to municipalities, too. Getting back to a idea of <a href="http://www.telefreizeit.de/" target="_blank">Claas Hanken</a> (a ex-collegue of mine), wanted to visualize these ones. The result can be seen in <a href="http://www.ifib.de/blog/index.php/site/comments/twitternde_kommunen_auf_der_karte/" target="_blank">German</a> and in <a href="http://www.govloop.com/profiles/blogs/putting-german-municipalities" target="_blank">Englisch</a>. The plot is completely done in R and I will show how it&#8217;s done.</p>
<p>As mentioned in the German post was mentioned that the raw data came from a simple tab-delimerted table with the Twittername, Homepage-URL and latitude and longitude information. A example for Berlin:</p>
<blockquote><p>@berlin_de_news    http://www.berlin.de    52.51, 13.40</p></blockquote>
<p>The full data can be accessed <a href="http://www.arnehendrikschulz.de/wp-content/uploads/2011/04/verwaltungen.txt">here</a>. So we load the data into R and do some data-management. Latitude and longitude are comma-seperated and there are no variable names given.</p>

<div class="wp_codebox"><table><tr id="p1625"><td class="code" id="p162code5"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">data</span> <span style="color: #080;">&lt;</span> <span style="color: #080;">-</span> <span style="color: #0000FF; font-weight: bold;">read.<span style="">delim</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;verwaltungen.txt&quot;</span>, header <span style="color: #080;">=</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/F.html"><span style="color: #0000FF; font-weight: bold;">F</span></a><span style="color: #080;">&#41;</span>
lat_lon <span style="color: #080;">&lt;-</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/as.numeric.html"><span style="color: #0000FF; font-weight: bold;">as.<span style="">numeric</span></span></a><span style="color: #080;">&#40;</span><a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/do.call.html"><span style="color: #0000FF; font-weight: bold;">do.<span style="">call</span></span></a><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;rbind&quot;</span>, str_split<span style="color: #080;">&#40;</span><span style="color: #0000FF; font-weight: bold;">data</span>$V3, <span style="color: #ff0000;">&quot;, &quot;</span><span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span>
data2 <span style="color: #080;">&lt;-</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/cbind.html"><span style="color: #0000FF; font-weight: bold;">cbind</span></a><span style="color: #080;">&#40;</span><span style="color: #0000FF; font-weight: bold;">data</span><span style="color: #080;">&#91;</span>, <span style="color: #ff0000;">1</span><span style="color: #080;">:</span><span style="color: #ff0000;">2</span><span style="color: #080;">&#93;</span>, lat_lon<span style="color: #080;">&#91;</span><span style="color: #ff0000;">1</span><span style="color: #080;">:</span><span style="color: #ff0000;">68</span><span style="color: #080;">&#93;</span>, lat_lon<span style="color: #080;">&#91;</span><span style="color: #ff0000;">69</span><span style="color: #080;">:</span><span style="color: #ff0000;">136</span><span style="color: #080;">&#93;</span><span style="color: #080;">&#41;</span>
<a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/names.html"><span style="color: #0000FF; font-weight: bold;">names</span></a><span style="color: #080;">&#40;</span>data2<span style="color: #080;">&#41;</span> <span style="color: #080;">&lt;-</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/c.html"><span style="color: #0000FF; font-weight: bold;">c</span></a><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;tw_name&quot;</span>, <span style="color: #ff0000;">&quot;url&quot;</span>, <span style="color: #ff0000;">&quot;lat&quot;</span>, <span style="color: #ff0000;">&quot;lon&quot;</span><span style="color: #080;">&#41;</span></pre></td></tr></table></div>

<p>Using the great <a href="http://cran.r-project.org/web/packages/twitteR/" target="_blank">twitteR-package</a> from Jeff Gentry we can get the total tweets ever send and the actual follower. A little for-loop does some automatation for us.
</pre>

<div class="wp_codebox"><table><tr id="p1626"><td class="code" id="p162code6"><pre class="rsplus" style="font-family:monospace;"><a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/for.html"><span style="color: #0000FF; font-weight: bold;">for</span></a> <span style="color: #080;">&#40;</span>i <span style="color: #0000FF; font-weight: bold;">in</span> data2$tw_name<span style="color: #080;">&#41;</span> <span style="color: #080;">&#123;</span>
  temp <span style="color: #080;">&lt;</span> <span style="color: #080;">-</span> statusesCount<span style="color: #080;">&#40;</span>getUser<span style="color: #080;">&#40;</span>i<span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span>
  temp2 <span style="color: #080;">&lt;-</span> followersCount<span style="color: #080;">&#40;</span>getUser<span style="color: #080;">&#40;</span>i<span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span>
  <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/if.html"><span style="color: #0000FF; font-weight: bold;">if</span></a> <span style="color: #080;">&#40;</span>i <span style="color: #080;">==</span> <span style="color: #ff0000;">&quot;@ahlen_de&quot;</span><span style="color: #080;">&#41;</span> <span style="color: #080;">&#123;</span>
    count_tweets <span style="color: #080;">&lt;-</span> temp
    follower <span style="color: #080;">&lt;-</span> temp2
  <span style="color: #080;">&#125;</span> <span style="color: #0000FF; font-weight: bold;">else</span> <span style="color: #080;">&#123;</span>
    count_tweets <span style="color: #080;">&lt;-</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/append.html"><span style="color: #0000FF; font-weight: bold;">append</span></a><span style="color: #080;">&#40;</span>count_tweets, temp<span style="color: #080;">&#41;</span>
    follower <span style="color: #080;">&lt;-</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/append.html"><span style="color: #0000FF; font-weight: bold;">append</span></a><span style="color: #080;">&#40;</span>follower, temp2<span style="color: #080;">&#41;</span>
  <span style="color: #080;">&#125;</span>
<span style="color: #080;">&#125;</span>
&nbsp;
data2 <span style="color: #080;">&lt;-</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/cbind.html"><span style="color: #0000FF; font-weight: bold;">cbind</span></a><span style="color: #080;">&#40;</span>data2, count_tweets, follower<span style="color: #080;">&#41;</span></pre></td></tr></table></div>

<p>Having the data prepared we only need a little spatial data from the <a href="http://www.gadm.org/" target="_blank">GADM database of Global Administrative Areas</a>. One could download the data by hand or using the <a href="http://cran.r-project.org/web/packages/raster/" target="_blank">raster-package</a> (as I will do).  <a href="http://had.co.nz/ggplot2/" target="_blank">Ggplot2</a>'s fortify will then prepare the borders for plotting.  If you get an Error from fortify try executing <em>gpclibPermit()</em>.
</pre>

<div class="wp_codebox"><table><tr id="p1627"><td class="code" id="p162code7"><pre class="rsplus" style="font-family:monospace;">de_map <span style="color: #080;">&lt;</span> <span style="color: #080;">-</span> getData<span style="color: #080;">&#40;</span><span style="color: #ff0000;">'GADM'</span>, country<span style="color: #080;">=</span><span style="color: #ff0000;">&quot;DE&quot;</span>, level<span style="color: #080;">=</span><span style="color: #ff0000;">1</span><span style="color: #080;">&#41;</span>
de_map_2 <span style="color: #080;">&lt;-</span> fortify<span style="color: #080;">&#40;</span>de_map, region <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;NAME_1&quot;</span><span style="color: #080;">&#41;</span></pre></td></tr></table></div>

<p>Now it's time to start the show! The plotting should take some time: The spacial data consists about 100k points. You could reduce the size by for example just taking every 5th point but that can cause double borders instead of one in some mapparts.<br />
Usually one would start plotting the points (<em>geom_point()</em>). In this case it would cause the borders to overlap the municipalities. <em>Scale_area()</em> is very helpful because there is a gap between Berlin and the other cities. I also adjusted the <em>limits</em> of the Follower count. The rest should speak for itself.
</pre>

<div class="wp_codebox"><table><tr id="p1628"><td class="code" id="p162code8"><pre class="rsplus" style="font-family:monospace;">tw <span style="color: #080;">&lt;</span> <span style="color: #080;">-</span> ggplot<span style="color: #080;">&#40;</span><span style="color: #0000FF; font-weight: bold;">data</span><span style="color: #080;">=</span> data2<span style="color: #080;">&#41;</span> <span style="color: #080;">+</span> geom_path<span style="color: #080;">&#40;</span><span style="color: #0000FF; font-weight: bold;">data</span> <span style="color: #080;">=</span> de_map_2, aes<span style="color: #080;">&#40;</span>x <span style="color: #080;">=</span> long, y <span style="color: #080;">=</span> lat, group <span style="color: #080;">=</span> group<span style="color: #080;">&#41;</span>, colour <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;#8D8D8D&quot;</span>, linetype <span style="color: #080;">=</span> <span style="color: #ff0000;">2</span><span style="color: #080;">&#41;</span>
tw <span style="color: #080;">&lt;-</span> tw <span style="color: #080;">+</span> geom_point<span style="color: #080;">&#40;</span>aes<span style="color: #080;">&#40;</span>x <span style="color: #080;">=</span> lon, y <span style="color: #080;">=</span> lat, colour <span style="color: #080;">=</span> follower, size <span style="color: #080;">=</span> count_tweets<span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span> <span style="color: #080;">+</span> scale_area<span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;Tweet count&quot;</span><span style="color: #080;">&#41;</span>
tw <span style="color: #080;">&lt;-</span> tw <span style="color: #080;">+</span> theme_bw<span style="color: #080;">&#40;</span><span style="color: #080;">&#41;</span> <span style="color: #080;">+</span> labs<span style="color: #080;">&#40;</span>x <span style="color: #080;">=</span> NULL, y <span style="color: #080;">=</span> NULL<span style="color: #080;">&#41;</span> <span style="color: #080;">+</span>  scale_colour_gradient<span style="color: #080;">&#40;</span>low <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;#9D9D9D&quot;</span>, high <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;#242424&quot;</span>, name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;Follower count&quot;</span>, limits <span style="color: #080;">=</span> <a href="http://astrostatistics.psu.edu/su07/R/html/graphics/html/c.html"><span style="color: #0000FF; font-weight: bold;">c</span></a><span style="color: #080;">&#40;</span><span style="color: #ff0000;">0</span>, <span style="color: #ff0000;">12000</span><span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span>
tw <span style="color: #080;">&lt;-</span> tw <span style="color: #080;">+</span> scale_x_continuous<span style="color: #080;">&#40;</span>breaks <span style="color: #080;">=</span> NA<span style="color: #080;">&#41;</span> <span style="color: #080;">+</span> scale_y_continuous<span style="color: #080;">&#40;</span>breaks <span style="color: #080;">=</span> NA<span style="color: #080;">&#41;</span>
tw <span style="color: #080;">&lt;-</span> tw <span style="color: #080;">+</span> opts<span style="color: #080;">&#40;</span><a href="http://astrostatistics.psu.edu/su07/R/html/stats/html/title.html"><span style="color: #0000FF; font-weight: bold;">title</span></a> <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;Municipalities using Twitter&quot;</span><span style="color: #080;">&#41;</span>
tw</pre></td></tr></table></div>

<p>An this is how it looks like:</p>
<p><img class="aligncenter size-medium wp-image-186" title="plot_blog" src="http://www.arnehendrikschulz.de/wp-content/uploads/2011/04/plot_blog-500x500.png" alt="" width="500" height="500" /></pre>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2011/08/12/plotting-german-municipalities-using-twitter/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Postleitzahlen visualisiert, Teil 2</title>
		<link>http://www.ahschulz.de/2011/03/21/postleitzahlen-visualisiert-teil-2/</link>
		<comments>http://www.ahschulz.de/2011/03/21/postleitzahlen-visualisiert-teil-2/#comments</comments>
		<pubDate>Mon, 21 Mar 2011 20:43:17 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[Visualisierung]]></category>
		<category><![CDATA[Code]]></category>
		<category><![CDATA[Map]]></category>
		<category><![CDATA[Package]]></category>
		<category><![CDATA[Postleitzahl]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=153</guid>
		<description><![CDATA[Im vorherigen Beitrag habe ich die deutschen Postleitzahlen visualisiert. Sort konnte man bereits sehr schön sehen, wie sich nur aus den Geo-Koordinaten die Deutschlandkarte abgebildet hat. Mit einer farblichen Unterleung fiel zudem auf, die Postleitzahlen sich nicht an den Längergrenzen &#8230; <a href="http://www.ahschulz.de/2011/03/21/postleitzahlen-visualisiert-teil-2/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.arnehendrikschulz.de/2011/01/06/postleitzahlen-visualisiert/">Im vorherigen Beitrag</a> habe ich die deutschen Postleitzahlen visualisiert. Sort konnte man bereits sehr schön sehen, wie sich nur aus den Geo-Koordinaten die Deutschlandkarte abgebildet hat. Mit einer farblichen Unterleung fiel zudem auf, die Postleitzahlen sich nicht an den Längergrenzen orientieren. Um dies weiter zu verdeutlichen habe ich die Ländergrenzen mit eingezeichnet.</p>
<p>Dazu nehmen wir erneut die Daten aus dem vorherigen Beitrag (&#8220;plz&#8221;). Das <a href="http://cran.r-project.org/web/packages/raster/index.html" target="_blank">raster</a>-Package ist so nett und gibt uns Zugriff auf die <a href="http://www.gadm.org/" target="_blank">GADM-Datenbank</a>, in welcher alle Grenzen Deutschlands (und natürlich noch die vieler weiterer Staaten) hinterlegt sind.</p>
<pre>library(raster)

de_map &lt;- getData('GADM', country="DE", level=1)
de_map_2 &lt;- fortify(de_map, region = "NAME_1")
</pre>
<p>Die Level-Angabe im ersten Befehl gibt an, wie detailliert die Daten sein sollen: Level 0 beinhaltet nur die Ländergrenzen, Level 1 auch die Grenzen der Ländergrenzen usw. Sollte <em>fortify</em> nicht sofort klappen, muss einmal der folgende Befehl ausgeführt werden:</p>
<pre>gpclibPermit()
</pre>
<p>Danach kann die Map mittels des folgenden Befehls geplottet werden, natürlich wieder mit ggplot2:</p>
<pre>p2 &lt;- ggplot(data= plz) + geom_point(aes(x = lon, y = lat, colour = region), //
   alpha = 0.8, shape = 19, size = 2)
p2 &lt;- p2 + geom_path(data = de_map_2, aes(x = long, y = lat, group = group), //
   colour = "grey20")
p2 &lt;- p2 + theme_bw() + labs(x = NULL, y = NULL) + //
   scale_colour_brewer(palette = "RdYlGn", name = "PLZ")
p2 &lt;- p2 + scale_x_continuous(breaks = NA) + scale_y_continuous(breaks = NA)
p2
</pre>
<p>Das Ergebnis sieht dann wie folgt aus:</p>
<p style="text-align: center;"><img class="size-full wp-image-138  aligncenter" title="PLZ Deutschland 3" src="http://www.arnehendrikschulz.de/wp-content/uploads/2011/01/plz_de_3.png" alt="" width="450" height="616" /></p>
<p>Hier wird noch deutlicher, dass die Postleitzahlen nicht nach Ländern vergeben wurden.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2011/03/21/postleitzahlen-visualisiert-teil-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Postleitzahlen visualisiert</title>
		<link>http://www.ahschulz.de/2011/01/06/postleitzahlen-visualisiert/</link>
		<comments>http://www.ahschulz.de/2011/01/06/postleitzahlen-visualisiert/#comments</comments>
		<pubDate>Thu, 06 Jan 2011 18:16:32 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[Visualisierung]]></category>
		<category><![CDATA[Deutschland]]></category>
		<category><![CDATA[Map]]></category>
		<category><![CDATA[Package]]></category>
		<category><![CDATA[Postleitzahl]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=124</guid>
		<description><![CDATA[Seit neuestem gibt es ein neues R-Package von Jeffrey Brenn in welchem sämtliche Postleitzahlen und Koordinaten der USA hinterlegt sind. Passend dazu findet sich in eine nette kleine Visualisierung. Sowas müsste sich doch auch für Deutschland realisieren lassen. Und siehe &#8230; <a href="http://www.ahschulz.de/2011/01/06/postleitzahlen-visualisiert/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Seit neuestem gibt es ein neues <a href="http://jeffreybreen.wordpress.com" target="_blank">R-Package von Jeffrey Brenn</a> in welchem sämtliche Postleitzahlen und Koordinaten der USA hinterlegt sind. Passend dazu findet sich in eine <a href="http://jeffreybreen.wordpress.com/2011/01/05/cran-zipcode/" target="_blank">nette kleine Visualisierung</a>. Sowas müsste sich doch auch für Deutschland realisieren lassen. Und siehe da: Es geht!<br />
Die <a href="http://opengeodb.giswiki.org/wiki/OpenGeoDB" target="_blank">OpenGeoDB</a> hat es sich zur Aufgabe gemacht, eine umfangreiche Datenbank mit GeoDaten und Postleitzahlen aufzubauen. Der große Unterschied hierzu ist, dass die Daten in den USA aus amtlichen Quellen stammen und daher auch mehr Informationen enthalten. Aber für meine Zwecke sind die deutschen Daten vollkommen ausreichend. Darüber hinaus bestehen Bestrebungen, die Datenbank stetig zu erweitern.</p>
<p>Die Daten liegen sowohl tabulatorgestrennt als auch in reiner Datenbankform (sehr löblich) vor. Für unsere Zwecke reichen aber erstmal die Daten mit Postleitzahlen und Koordinaten: <a href="http://fa-technik.adfc.de/code/opengeodb/PLZ.tab" target="_blank">http://fa-technik.adfc.de/code/opengeodb/PLZ.tab</a></p>
<p>Mit der Datei machen wir uns dann ans Werk. Vorher laden wir noch das entsprechende <a href="http://cran.r-project.org/web/packages/zipcode/" target="_blank">zipcode</a>-Package und das <a href="http://cran.r-project.org/web/packages/ggplot2/" target="_blank">ggplot2</a>-Package. Ersteres kommt mit der netten Funktion clean.zipcode(), die unter anderem dafür sorgt, dass Postleitzahlen, die mit &#8220;0&#8243; beginnen, diese auch behalten. Ggplot2 verwenden wir, um die Daten zu visualisieren.</p>
<pre>library(ggplot2)
library(zipcode)

# Daten laden
plz &lt;- read.delim("Data/PLZ.tab")

# Postleitzahlen mit 0 erhalten
plz$plz_2 &lt;- clean.zipcodes(plz$plz)

# Plotten
p &lt;- ggplot(data= plz) + geom_point(aes(x = lon, y = lat))
</pre>
<p>Aussehen tut das Ganze dann wie folgt:</p>
<p style="text-align: center;"><img class="size-full wp-image-136  aligncenter" title="PLZ Deutschland 1" src="http://www.arnehendrikschulz.de/wp-content/uploads/2011/01/plz_de_1.png" alt="" width="450" height="602" /></p>
<p>Hier lässt sich bereits die Kontur Deutschlands sehr gut erkennen. Auffällig ist zudem, dass es in Brandenburg und Mecklenburg-Vorpommern recht &#8220;wenig&#8221; Postleitzahlen gibt. Vor allem im Süden, Süedwesten, Ruhrgebiet und im Norden kommt es dagegen zu einer deutlichen Häufig in den Verteilungen.</p>
<p>Noch interessanter wird die Karte, wenn man sich die erste Ziffer der Postleitzahl mit anzeigen lässt. Zudem kann man die Grafik noch ein wenig aufhübschen.</p>
<pre># Erste PLZ-Stelle als neue Variable einfügen
plz$region &lt;- (substr(plz$plz_2, 1, 1))

# Plotten
p &lt;- ggplot(data= plz) + geom_point(aes(x = lon, y = lat, colour = region),//
   shape = 19, size = 2)
p &lt;- p + theme_bw() + labs(x = NULL, y = NULL)
p &lt;- p + scale_colour_brewer(palette = "RdYlGn", name = "PLZ")
p &lt;- p + scale_x_continuous(breaks = NA) + scale_y_continuous(breaks = NA)
p
</pre>
<p style="text-align: center;"><img class="size-full wp-image-137  aligncenter" title="PLZ Deutschland 2" src="http://www.arnehendrikschulz.de/wp-content/uploads/2011/01/plz_de_2.png" alt="" width="450" height="616" /></p>
<p>Die verschiedenen PLZ-Bereiche sind nicht an die Grenzen der Bundesländer gebunden. Vielleicht sollte ich noch die Ländergrenzen mit einzeichnen lassen. Aber dazu später mehr&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2011/01/06/postleitzahlen-visualisiert/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Wird Winter&#8230;</title>
		<link>http://www.ahschulz.de/2010/12/19/wird-winter/</link>
		<comments>http://www.ahschulz.de/2010/12/19/wird-winter/#comments</comments>
		<pubDate>Sun, 19 Dec 2010 15:12:00 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Foto]]></category>
		<category><![CDATA[Tierwelt]]></category>
		<category><![CDATA[Winter]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=118</guid>
		<description><![CDATA[Letztens mal das Vogelhäuschen aufgefüllt &#8211; 5 Minuten später einmal nachgeschaut]]></description>
			<content:encoded><![CDATA[<p>Letztens mal das Vogelhäuschen aufgefüllt &#8211; 5 Minuten später einmal nachgeschaut</p>
<p><img class="aligncenter size-full wp-image-119" title="Eichhörnchen" src="http://www.arnehendrikschulz.de/wp-content/uploads/2010/12/eichhoernchen_20101219.jpg" alt="" width="500" height="503" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2010/12/19/wird-winter/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Kasseler useR! Group</title>
		<link>http://www.ahschulz.de/2010/06/20/kasseler-user-group/</link>
		<comments>http://www.ahschulz.de/2010/06/20/kasseler-user-group/#comments</comments>
		<pubDate>Sun, 20 Jun 2010 11:44:56 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[Kassel]]></category>
		<category><![CDATA[useR! Group]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=99</guid>
		<description><![CDATA[Seit neuestem gibt es eine useR!-Gruppe in Kassel. Das erste Treffen ist für den 24.06.2010 im Technologie- und Gründungszentrum (FiDT) geplant. Neben einer kurzen Einführung wird es um GUIs, Pakete und und &#8220;R Scene&#8221; gehen, eher allgemeien Themen eben. Darüber &#8230; <a href="http://www.ahschulz.de/2010/06/20/kasseler-user-group/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-medium wp-image-28" title="Rlogo" src="http://www.arnehendrikschulz.de/wp-content/uploads/2010/02/Rlogo-300x227.png" alt="" width="108" height="82" />Seit neuestem gibt es eine <a href="http://www.meetup.com/Kassel-useR-Group/" target="_blank">useR!-Gruppe</a> in Kassel. Das erste Treffen ist für den 24.06.2010 im Technologie- und Gründungszentrum (<a href="http://www.fidt.de/" target="_blank">FiDT</a>) geplant.</p>
<p>Neben einer kurzen Einführung wird es um GUIs, Pakete und und &#8220;R Scene&#8221; gehen, eher allgemeien Themen eben. Darüber hinaus wüird vor allem auch organisatorisches angesprochen werden.</p>
<p>Wer Interesse hat, ist herzlich willkommen: <a href="http://www.meetup.com/Kassel-useR-Group/" target="_blank">http://www.meetup.com/Kassel-useR-Group/</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2010/06/20/kasseler-user-group/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Anonym suchen (und finden)</title>
		<link>http://www.ahschulz.de/2010/06/20/anonym-suchen-und-finden/</link>
		<comments>http://www.ahschulz.de/2010/06/20/anonym-suchen-und-finden/#comments</comments>
		<pubDate>Sun, 20 Jun 2010 10:46:32 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[Datenschutz]]></category>
		<category><![CDATA[Der Spiegel]]></category>
		<category><![CDATA[EFF]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Ixquick]]></category>
		<category><![CDATA[Suchmaschine]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=80</guid>
		<description><![CDATA[Ich nutze seit Jahren Google für meine Internetrecherchen und bin (wie die meisten anderen wohl auch) sehr zufrieden mit den Ergebnissen. Die andere Seite der Medallie ist allerdings, dass Google seit Jahren massiv Daten seiner Nutzer sammelt. Wie viel Google &#8230; <a href="http://www.ahschulz.de/2010/06/20/anonym-suchen-und-finden/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full wp-image-86" title="Suchen und Finden" src="http://www.arnehendrikschulz.de/wp-content/uploads/2010/06/suchen_mini.jpg" alt="" width="150" height="113" />Ich nutze seit Jahren Google für meine Internetrecherchen und bin (wie die meisten anderen wohl auch) sehr zufrieden mit den Ergebnissen. Die andere Seite der Medallie ist allerdings, dass Google seit Jahren massiv Daten seiner Nutzer sammelt. Wie viel Google im Endeffekt über jemanden weiß, ist dabei nach wie vor unklar und wird außer Google wohl niemand erfahren. Den meisten Nutzern dürfte das bereits bekannt gewesen sein. Zwei interessante Mitteilungen haben mich seit neuestem aber aufgeschreckt:</p>
<ul>
<li>Der Spiegel-Titel anfang dieses Jahres (<a href="http://www.spiegel.de/spiegel/print/d-68621901.html" target="_blank">Web</a>/<a href="http://wissen.spiegel.de/wissen/image/show.html?did=68621901&amp;aref=image041/2010/01/09/ROSP201000200580069.PDF&amp;thumb=false" target="_blank">PDF</a>). Hier wurde einmal komprimiert dargestellt, was Google alles sammelt und was mit meinen Daten geschieht oder eines Tages geschehen kann.</li>
<li>Das <a href="https://panopticlick.eff.org" target="_blank">Panopticlick</a> der <a href="https://www.eff.org/" target="_blank">Electronic Fronitier Foundation (EFF)</a>. Auf der Seite kann man testen lassen, wie eindeutig der Fingerabdruck der Fingerabdruck des Browsers ist. Dabei wird auch auf installierte Systemschriftarten und installierte Plugins zurückgegriffen. Beide sollten bei vielen Nutzern relativ eindeutig sein. Meine System-/Browserkonfiguration scheint dabei einmalig bei über einer Million bisher getesteten Systemen zu sein. Damit scheint ein einfaches Abschalten der Cookies nicht mehr auszureichen.</li>
</ul>
<p>Natürlich muss man nicht Google verwenden. Yahoo oder Bing liefern sicher ähnliche Ergebnisse. Ich unterstelle beiden aber zu großen Teiles dasselbe Interesse an meinen Daten. Ich habe auch anonymisierte Google-Dienste wie <a href="http://www.scroogle.org" target="_blank">Scroogle</a> oder <a href="http://anonymouse.org/" target="_blank">Anonymouse</a> verwendet. Letztere kopiert dabei genau das Aussehen von Google, so dass ich auch mein <a href="http://www.bibsonomy.org" target="_blank">BibSonomy</a>-Plugin weiter verwenden kann. Leider blendet der Dienst kleine Werbebanner ein &#8211; das nervt!</p>
<p>Letztenendes bin ich jetzt bei Ixquick gelandet. <a href="http://www.ixquick.com/deu/" target="_blank">Ixquick</a> ist eine <a href="http://meta.rrzn.uni-hannover.de/what.is.meta.html" target="_blank">Meta-Suchmaschine</a>, die ihre Ergebnisse unter anderem aus Yahoo und Bing bezieht und dabei viel Wert auf <a href="http://www.ixquick.com/deu/protect-privacy.html" target="_blank">Datenschutz</a> legt. Bisher bin ich mit der Suchmaschine sehr zufrieden. Einzig Google Scholar vermisse ich von Zeit zu Zeit&#8230;</p>
<p><small>© Miniaturbild: <a href="http://www.sxc.hu/profile/wagg66" target="_blank">Carl Dwyer </a></small></p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2010/06/20/anonym-suchen-und-finden/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Arbeitsraum bekommen</title>
		<link>http://www.ahschulz.de/2010/04/09/arbeitsraum-bekommen/</link>
		<comments>http://www.ahschulz.de/2010/04/09/arbeitsraum-bekommen/#comments</comments>
		<pubDate>Fri, 09 Apr 2010 13:15:27 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[Master-Thesis]]></category>
		<category><![CDATA[Uni]]></category>
		<category><![CDATA[Arbeitsraum]]></category>
		<category><![CDATA[Bild]]></category>
		<category><![CDATA[Masterarbeit]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=51</guid>
		<description><![CDATA[Gestern Abend habe ich eine erfreuliche Mail bekommen, dass mein Arbeitsraum in der Uni bereits heute anstatt Montag frei ist. Also heute morgen Monitor, USB-Dock und allen möglichen Peripherie-Krams eingepackt und ab zur Uni. Ich habe dann auch problemlos meinen &#8230; <a href="http://www.ahschulz.de/2010/04/09/arbeitsraum-bekommen/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Gestern Abend habe ich eine erfreuliche Mail bekommen, dass mein Arbeitsraum in der Uni bereits heute anstatt Montag frei ist. Also heute morgen Monitor, USB-Dock und allen möglichen Peripherie-Krams eingepackt und ab zur Uni. Ich habe dann auch problemlos meinen Raum bekommen und mich gleich ein wenig häuslich eingerichtet.</p>
<p style="text-align: center;"><img class="size-medium wp-image-55 aligncenter" title="Arbeitsraum1" src="http://www.arnehendrikschulz.de/wp-content/uploads/2010/04/Arbeitsraum1-500x375.jpg" alt="" width="500" height="375" /></p>
<p style="text-align: left;">Auf der linken Seite befindet sich noch nicht sichtbar ein großes Regal. Die Wände sind noch etwas sehr weiß und jungfräulich. Das wird sich in den nächsten Wochen aber noch sicher ändern. Zumal ich die nächsten sechs Monate mindestens 30 Stunden pro Woche hier verbringen werde.</p>
<p style="text-align: left;">Dann kann die Masterarbeit ja kommen&#8230; <img src='http://www.ahschulz.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2010/04/09/arbeitsraum-bekommen/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Cisco VPN und Windows 64Bit</title>
		<link>http://www.ahschulz.de/2010/03/19/cisco-vpn-und-windows-64bit/</link>
		<comments>http://www.ahschulz.de/2010/03/19/cisco-vpn-und-windows-64bit/#comments</comments>
		<pubDate>Fri, 19 Mar 2010 13:57:40 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[Programme]]></category>
		<category><![CDATA[Uni]]></category>
		<category><![CDATA[Cisco]]></category>
		<category><![CDATA[VPN]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=47</guid>
		<description><![CDATA[Auf meinen Laptop verwende ich als Betriebssystem mittlerweile Windows 7 als 64Bit-Version. Ich bin im Großen und Ganzen sehr zufrieden, aber das ist eine andere Sache. Einziges Problem bestand bisher darin, dass die Uni den Datenverkehr ihrer WLAN-Netze über VPN &#8230; <a href="http://www.ahschulz.de/2010/03/19/cisco-vpn-und-windows-64bit/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Auf meinen Laptop verwende ich als Betriebssystem mittlerweile Windows 7 als 64Bit-Version. Ich bin im Großen und Ganzen sehr zufrieden, aber das ist eine andere Sache. <img src='http://www.ahschulz.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' />  Einziges Problem bestand bisher darin, dass die Uni den Datenverkehr ihrer WLAN-Netze über VPN von Cisco absichert. Wunderbarerweise gibt es die Software nur als 32Bit und ist somit inkompatibel zu meinem Windows. Linux-Nutzer können da ja auch <a href="http://www.unix-ag.uni-kl.de/~massar/vpnc/" target="_self">vpnc</a> ausweichen &#8211; ich leider nicht.</p>
<p>Abhilfe schafft da aber der <a href="http://www.shrew.net/download/vpn" target="_blank">VPN-Client von Shrew Soft</a>. Dieser ist frei verfügbar und lässt sich problemlos installieren. Zudem lassen sich die Zertifikate (*.pcf) von Cisco ebenfalls importieren, so dass in der Regel keine weitere Konfiguration nötig ist. Ich bin mit dem Programm sehr zufrieden und finde es zudem deutlich schlanker als der originale Client von Cisco.</p>
<p>Und natürlich funktioniert das Programm auch auf allen Windows&#8217;en mit 32Bit. <img src='http://www.ahschulz.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2010/03/19/cisco-vpn-und-windows-64bit/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Stadtistik</title>
		<link>http://www.ahschulz.de/2010/03/04/stadtistik/</link>
		<comments>http://www.ahschulz.de/2010/03/04/stadtistik/#comments</comments>
		<pubDate>Thu, 04 Mar 2010 21:15:17 +0000</pubDate>
		<dc:creator>Arne</dc:creator>
				<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Visualisierung]]></category>
		<category><![CDATA[Print]]></category>
		<category><![CDATA[Stadt]]></category>

		<guid isPermaLink="false">http://www.arnehendrikschulz.de/?p=40</guid>
		<description><![CDATA[Einen interessanten Ansatz statistische Kennwerte verschiedener Städte darzustellen, hat Martin Oberhäuser in seiner Diplomarbeit entwickelt: Das Projekt läuft unter dem Titel Stadtistik (Verbindung von Stadt und Statistik). Ich finde den vergleichenden Ansatz sehr ansehlich und innovativ. Zudem können mehrere Städte &#8230; <a href="http://www.ahschulz.de/2010/03/04/stadtistik/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Einen interessanten Ansatz statistische Kennwerte verschiedener Städte darzustellen, hat Martin Oberhäuser in seiner <a href="http://www.behance.net/Gallery/Stadtistik-City-Statistics/226537" target="_self">Diplomarbeit</a> entwickelt:</p>
<p><img class="alignnone" title="Stadtistik" src="http://behance.vo.llnwd.net/profiles3/104095/projects/226537/1040951242320384.jpg" alt="" width="600" height="400" /></p>
<p><img class="alignnone" title="Stadtistik" src="http://behance.vo.llnwd.net/profiles3/104095/projects/226537/1040951242320305.jpg" alt="" width="600" height="400" /></p>
<p><img class="alignnone" title="Stadtistik" src="http://behance.vo.llnwd.net/profiles3/104095/projects/226537/1040951242321787.jpg" alt="" width="600" height="400" /></p>
<p><img class="alignnone" title="Stadtistik" src="http://behance.vo.llnwd.net/profiles3/104095/projects/226537/1040951242322096.jpg" alt="" width="600" height="400" /></p>
<p>Das Projekt läuft unter dem Titel Stadtistik (Verbindung von Stadt und Statistik). Ich finde den vergleichenden Ansatz sehr ansehlich und innovativ. Zudem können mehrere Städte leicht verglichen werden, ohne ellenlange Tabellen zu lesen.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.ahschulz.de/2010/03/04/stadtistik/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

